メチル化データ解析チュートリアル
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
もしHISAT2のインデックスファイルがウェブサイトから提供されていなければ、その生物種のインデックスはご自身で作る必要があります。この解説は、Linux や Unix のコマンド操作に慣れていない方を想定しています。 Windowsユーザーだけが必要な準備 WindowsでLinuxシステム用に作られたバイオインフォマティクスツールを使用するために、WSLを導入したと思います。この場合、イ...
このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...
GSEからFASTQファイルをダウンロードする場合、サンプルごとに一つ一つダウンロードしなくてはいけないので、かなり面倒ですが、複数の画面を使って同時に実行するとよいでしょう。 手順 1. GEOのウェブサイトで GSM record のページを開く。2. ページの下までスクロールすると、対応するSRXへリンクがあるので、これをクリックする。3. シーケンスリードに関する情報、特にそれが S...
Subio Platform が正しくペア―ドエンドサンプルを見つけられないときは、FASTQファイルの名前を下のように付け直して下さい。 XXX_1.fastq.gzXXX_2.fastq.gzYYY_1.fastq.gzYYY_2.fastq.gzZZZ_1.fastq.gzZZZ_2.fastq.gz XXX, YYY, ZZZ はサンプル名、_1 と _2 はペアを表します。
Creating a platform of Ensembl genes. Download Subio Platform v1.24からは、Ensembl Genes GRCh38.p13バージョンのPlatformがインストーラーにバンドルされています。それ以前のバージョンからお使いのユーザーは、このムービーを見ながらご自身でPlatformを作成してください。 このチュートリアルは、...
Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、 fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...
これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...
これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...
TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...
integrate multi-omics data sets Download このデモでは、擬似的なトランスクリプトミクス、プロテオミクス、メタボロミクスのデータセットを統合し、Subio Platform の Pathway View にまとめて表示する方法をご紹介します。 やり方は二通りあります。 元のIDを保持したまま、Platformを統合する 元のIDは使わず、Gene ID...
RNA-Seqのデータ(Counts / TPM / FPKM / RPKM)をインポートする。 Download 1:50 より前 ; RNA-Seq データ(Counts/FPKM/RPKM)のインポート 1:50 より後 ; 遺伝子アノテーションのインポート 関連トピック RNA-SeqのFASTQファイル処理
アジレントのマイクロアレイデータをインポートする。 Download 00:00 - 01:401色法のデータをインポートする 01:40 - 02:452色法のデータをインポートする 02:45 - 2色法のデータをインポートする(dye swap デザインの場合)
Create A Platform of An Agilent Microarray Download 遺伝子発現マイクロアレイをお使いの場合は、こちらのパートをご覧ください 0:00 eArray のサイトからアノテーションファイルをダウンロードする 1:00 アノテーションファイルをインポートして、Platform を作成する 1:20 gene symbol 列をセットする 1:30...
Create A Platform of An Affymetrix Gene Chip Download 0:00 Affymetrix のウェブサイトから、CSV 形式の annotation ファイルをダウンロードする 0:30 拡張子を .csv から .txt に変更する 0:45 エクセルで開いてタブ区切りテキスト形式のファイルに変換する、ただしこのやり方でないと、一部の G...
TACソフトウェアを使ってCELファイルを処理し、そこからエクスポートしたSignal値と遺伝子アノテーションを、Subio Platformにインポートする。 Download Subio Platformは、GeneChipのCELファイルを直接扱うことができません。そこで、Thermo Fisher Scientificのウェブサイトから無料で入手できるTranscriptome A...
簡単かつ詳細なマイクロアレイデータ解析の例 Download 多くの人が統計学などの特別なツールがないとデータ解析はできないと思っているようですが、オミクスデータ解析の本質にとってツールはそれほど重要ではありません。逆に言うと、そのツールさえ使っていれば解析については安心だということもないのです。大事なのは、データがどのようなものか、そしてどのように処理しているかを正しく理解していることで...
miRNAとターゲット遺伝子で、発現パターンが逆向きのペアを検索する。 Download Find miRNA Targets ツールは、遺伝子とmiRNAの実験データが対でそろっている場合に使えます。ここでは、実験的に検証されたmiRNAとターゲット遺伝子のペアや、計算によって予測されたmiRNAとターゲット遺伝子のペアのうち、発現パターンが逆相関になっているものを抽出します。すべてのペ...
RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...