変異データ解析チュートリアル(RNA-Seq の FASTQ ファイルから)
特にWindowsをお使いの方にとっては、RNA-SeqのFASTQファイルから GATKを使って変異を検出するもっとも簡単な方法だと思います。そして、たとえば Normal vs. Disease のような実験において、Disease で多く見られる変異、あるいはDiseaseで変異の多い遺伝子をもっとも簡単に抽出することができるツールでしょう。 RNA-SeqのFASTQファイルから、ゲ...
特にWindowsをお使いの方にとっては、RNA-SeqのFASTQファイルから GATKを使って変異を検出するもっとも簡単な方法だと思います。そして、たとえば Normal vs. Disease のような実験において、Disease で多く見られる変異、あるいはDiseaseで変異の多い遺伝子をもっとも簡単に抽出することができるツールでしょう。 RNA-SeqのFASTQファイルから、ゲ...
このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...
ターゲット遺伝子のエクソンごとに変異を集計する。特定のエクソン上の変異を抽出する。 Download このツールは、Aggregate Variants や Aggregate Variants per Gene ツールで解析した後に使用してください。対象遺伝子の候補をリストアップした後、候補ごとにエクソンごとに要約することができます。 また、エクソンによるフィルタツールは、指定された転写...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
遺伝子リストから関連の示唆されるGOやパスウェイを検索する。 Download Enrichment Analysis tool は、抽出した遺伝子リストを生物学的コンテキストで解釈するのによく使われます。Gene Ontology (GO)はもちろんですが、パスウェイやサイトバンド、タンパクドメイン、miRNAのターゲットや転写因子のターゲット検索など、幅広い用途に使える便利なツールです...
TSS Plot Download TSS Plot ツールは、何らかの値とTSSからの相対距離の関係を視覚化するものです。 よくあるのは、転写調節因子の結合や、DNAまたはヒストンの就職などのイベントの数をヒストグラムで表した図です。Subio PaltformのTSS Plotでは、さらに、メチル化比率や、メチル化状態の上昇または減退といった変化、遺伝子発現パターンとメチル化状態の変化...
Import MSigDB Gene Sets / Find Measurement Lists or Pathways Download Molecular Signatures Database (MSigDB) は、GSEAソフトウェアで使用するアノテーションされた遺伝子セットのコレクションで、大きく8つに分類されます。 Hall mark gene sets, よく知られた生物学的...
複数のPlatformを跨るマルチオミクスデータの統合解析の準備をする。 Download このツールは、複数のオミックスデータセットを統合するために、さまざまなプラットフォームで共通のサンプルを見つけて印を付けます。このツールはFind miRNA Targets や Find Correlated Regions を使って解析を行うための準備を簡単に行えるようにするユーティリティです。...
GO解析について Gene Ontology (GO) 解析でしたら、(1) DAVID Functional Annotation のウェブツールを使うか、(2) Advanced Plug-in に含まれる "Enrichment Analysis" ツールを使ってできます。さらに、後者は System Plug-in に含まれる "Import MSigDB Gene Sets" ツー...
検索の基本テクニック Download Subio Platform は高度な検索機能を提供しています。このチュートリアルでは検索機能を使いこなすためのノウハウを紹介します。これらのテクニックは他の検索パネルでも使えます。 正規表現 の詳しい文法は、グーグル検索してみてください。
カプランマイヤー生存曲線を描画する。 Download Kaplan-Meier Survival Curve Tool を使って、カプランマイヤー生存曲線を描画するための準備について解説します。 ある治療を実施したグループとそうでないグループに分けて生存率を比較するなどはこれまで沢山の報告があります。Subio Platformに蓄積されたオミクスデータを使えば、たとえば、特定の遺伝子が...
PCAスコアをエクセルで再現する方法 Download このチュートリアルでは、Subio PlatformのScatter Plot (Samples) Viewで表示されているPCAスコアを、エクセル(あるいは他のソフトウェア)上で再現する手順をご紹介します。 この操作がよくわからないときは、無料オンラインサポートをお申し込みください。
Annotations タブから1クリックでプローブシーケンスをBLASTしたい場合は、下記の定義文をWeb Linkに設定してください。 https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Put&QUERY=[SEQUENCE]&PROGRAM=blastn&FILTER=L&DATABASE=nr&A...
integrate multi-omics data sets Download このデモでは、擬似的なトランスクリプトミクス、プロテオミクス、メタボロミクスのデータセットを統合し、Subio Platform の Pathway View にまとめて表示する方法をご紹介します。 やり方は二通りあります。 元のIDを保持したまま、Platformを統合する 元のIDは使わず、Gene ID...
Genome View の使い方 Download Genome View は、ChIP-SeqやMethyl-Seq、タイリングアレイ、CGH アレイなどのゲノムの位置と深くかかわるデータの解析に必須のゲノムブラウザーです。遺伝子発現データを見ているときも、この視覚化ツールを使って発現が上昇あるいは減少している遺伝子群が、染色体の特定の領域に固まって存在しているかどうかを確認することで、...
ゲノム上で、指定した塩基配列の個所を検索する。 Download Find Regions from Seq ツールは、特定の塩基配列を検索して、その位置を Region List として保存するものです。このムービーでは、FOXO1の制御配列を遺伝子の上流域に対して検索し、FOXO1によって制御されている可能性のある遺伝子を抽出します。 このツールの使い方がよくわからないときは、無料オン...
MeasurementをRegionに変換する。Regionにフィルターをかける。 Download Seriesは一度にひとつずつしかロードできませんので、あるSeriesで使っていた Measurement List や DataSet は、別の Series をロードすると利用できなくなります。そこで、これらのデータを Region List に変換しておくと、Seriesをまたがっ...
異なる種類のオミクスデータを統合して、散布図を描く。 Download 異なるタイプのオミクスデータでも Region List に変換しておけば、Scatter Plot of Regions ツールを使って直接比較することができます。 たとえば、遺伝子発現パターンと、その上流域のメチル化サイトのパターンや、染色体のコピー数とその領域にある遺伝子の発現パターンの関係を全体的に把握すること...
染色体に沿って、値が高い・低い領域を視覚化する。 Download Summarize ツールを使うと、近接するタグやプローブをまとめて平均値などにして、全体的なトレンドを視覚化できます。たとえば、遺伝子発現やDNAメチル化の度合いが高く(または低く)なっている染色体領域を把握するのにとても便利です。 まとめる単位は、遺伝子の転写領域や、コーディング領域、上流域、下流域、あるいは決まったサ...
遺伝子と近傍の因子で、互いのパターンが相関するペアを探す。 Download Fnd Correlated Regions ツールは、たとえば ChIP-Seq(またはChIP-chip)と遺伝子発現のデータが対でそろっているときや、DNAメチル化データと遺伝子発現データが対でそろっているときなどに、発現パターンを制御している可能性の高い制御因子を抽出することができます。具体的には、遺伝子...
ゲノム上の複数の領域を指定して、そのゲノム配列をFASTAにする。 Download 特定の発現パターンを示す遺伝子リストを抽出した後、それら遺伝子群の上流域の塩基配列がほしい場合があります。Get Sequence ツールは、そのような遺伝子群を指定して相対的な位置の塩基配列を取得するものです。 このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。
がんステージ・年齢・用量などと、相関する遺伝子を抽出する。 Download Genes Tied in Parameter ツールは、たとえば年齢、処理後の経過時間、生存期間などの数値パラメータと、発現パターンが相関あるいは逆相関の関係になっている遺伝子を抽出します。 このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。
ゲノム上の相対的な位置関係から、遺伝子やプローブなどを抽出する。 Download Geomic Location Filter ツールは、ゲノム上の相対的な位置に基づいて、ゲノム上のエレメント(遺伝子、プローブ、結合部位、メチル化サイトなど)を抽出するのに使います。このチュートリアルムービーでは、PHF8の結合部位を遺伝子の上流 2000 bp の範囲から抽出したり、逆にPHF8の結合部...
Pathway のデータをある Series から別の Series へコピーしたいときは、それらが同じ Platform 上にある場合は可能ですが、別の Platform 上にある場合はデータのインポートをやり直す必要があります。 Subio Platform 画面の左側の Series パネルの上部にある Import ボタンを押す Pathway タブを開いて、Source オプショ...
簡単かつ詳細なマイクロアレイデータ解析の例 Download 多くの人が統計学などの特別なツールがないとデータ解析はできないと思っているようですが、オミクスデータ解析の本質にとってツールはそれほど重要ではありません。逆に言うと、そのツールさえ使っていれば解析については安心だということもないのです。大事なのは、データがどのようなものか、そしてどのように処理しているかを正しく理解していることで...
Pathway View の使い方 Download Pathway View は、パスウェイ図の上に発現パターンをヒートマップや棒グラフで重ねて表示するものです。パスウェイ上でドラッグすると、その範囲に表示されている遺伝子を選択することができます。生物学的にデータを解釈するのにとても役に立つ視覚化ツールです。 操作がよくわからないときは、無料オンラインサポートをお申し込みください。
パスウェイを取り込み、図中の遺伝子の発現パターンを重ねて表示する。 Download Pathway Edit Tool は、任意の画像上にデータをヒートマップまたは棒グラフで重ねて表示する Pathway オブジェクトを作成・編集するものです。このツールは汎用的に作られているのでどのパスウェイにも対応できるのですが、まずは "KEGG Pathway Converter" ツールを別途提...
miRNAとターゲット遺伝子で、発現パターンが逆向きのペアを検索する。 Download Find miRNA Targets ツールは、遺伝子とmiRNAの実験データが対でそろっている場合に使えます。ここでは、実験的に検証されたmiRNAとターゲット遺伝子のペアや、計算によって予測されたmiRNAとターゲット遺伝子のペアのうち、発現パターンが逆相関になっているものを抽出します。すべてのペ...
ベン図ツールの使い方 Download Venn Diagram は、複数の Measurement List をベン図上で組合せて、それらの間で和集合、関集合、差集合などを抽出することができます。Series Panelから輪の中にドラッグ&ドロップしてセットします。輪は3つしかありませんが、もし3つ以上のMeasurement Listをかけ合わせたい場合は、# Overlapping...