メチル化データ解析チュートリアル
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
もしHISAT2のインデックスファイルがウェブサイトから提供されていなければ、その生物種のインデックスはご自身で作る必要があります。この解説は、Linux や Unix のコマンド操作に慣れていない方を想定しています。 Windowsユーザーだけが必要な準備 WindowsでLinuxシステム用に作られたバイオインフォマティクスツールを使用するために、WSLを導入したと思います。この場合、イ...
RNA-Seq FASTQファイル処理のパイプラインを設定するには、適切なHISAT2インデックスとGTFファイルを入手する必要があります。異なる生物種のものを使用したり、HISAT2インデックスとGTFのゲノムバージョンが不一致であったりしても、誤って正常に実行が完了してしまいます。そのため、パイプラインを実行する前に、これらのファイルが正しく選択されていることを確認してください。 提供さ...
fastpは、通常使われるアダプター配列に対応しておりますが、特殊なキットを使っている場合にアダプター配列を認識できないことがあります。その場合は、fastpのオプション設定欄で --adapter_sequence=AGATCGGAAGAGCACACGTCTGAACTCCAGTCA のようアダプター配列を教えてあげてください。 また、アダプターを取り除いた後のリード配列も、ターゲット以外の...
特にWindowsをお使いの方にとっては、RNA-SeqのFASTQファイルから GATKを使って変異を検出するもっとも簡単な方法だと思います。そして、たとえば Normal vs. Disease のような実験において、Disease で多く見られる変異、あるいはDiseaseで変異の多い遺伝子をもっとも簡単に抽出することができるツールでしょう。 RNA-SeqのFASTQファイルから、ゲ...
bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする Download bigWigファイルはサイズが巨大なことが多く、そのままインポートするとSubio Platformがオーバーフローしてしまいがちです。このムービーでは、ゲノム領域を絞ってデータをインポートすることで、データをうまく圧縮する方法を見つける方法を解説します。こうすることで、...
GSEからFASTQファイルをダウンロードする場合、サンプルごとに一つ一つダウンロードしなくてはいけないので、かなり面倒ですが、複数の画面を使って同時に実行するとよいでしょう。 手順 1. GEOのウェブサイトで GSM record のページを開く。2. ページの下までスクロールすると、対応するSRXへリンクがあるので、これをクリックする。3. シーケンスリードに関する情報、特にそれが S...
ターゲット遺伝子のエクソンごとに変異を集計する。特定のエクソン上の変異を抽出する。 Download このツールは、Aggregate Variants や Aggregate Variants per Gene ツールで解析した後に使用してください。対象遺伝子の候補をリストアップした後、候補ごとにエクソンごとに要約することができます。 また、エクソンによるフィルタツールは、指定された転写...
遺伝子ごとに変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグル...
変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグループにおける...
Annotate VCF Download SnpEffは 変異に対してアノテーションとそれがもたらす効果を予測するツールです。 Annotate VCF ツールは、このプログラムを Subio Platform から簡単に実行できるようにするものです。
FASTQ to VCF (RNA-Seq) Download このパイプラインは、GATKのRNAseq short variant discovery (SNPs + Indels)を参考にして作っています。ただし、メモリーの消費量を抑えるため、アラインメントにはSTARではなくHISAT2を使っています。実行する前に、環境のセットアップを行ってください。
この記事は、FASTQ to VCF ツールを使うための準備のためのものです。 これを始める前に これを始める前に、必ずRNA-Seq FASTQファイル処理パイプラインの設定のやり方(Windows 版)を完了してください。fastp と HISAT2 は同じなので、ここでは説明を省きます。ここでは、追加の GATK4 のインストールについて説明します。 環境設定パネル 設定のやり方...
この記事は、FASTQ to VCF ツールを使うための準備を行うためのものです。 GATK4のインストール これを始める前に、RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)を完了してください。ここで説明されている fastp と HISAT2 の設定は同じなので、ここでは省略します。これらに加え、bioconda経由で GATK4 をインストールします。...
Subio Platform が正しくペア―ドエンドサンプルを見つけられないときは、FASTQファイルの名前を下のように付け直して下さい。 XXX_1.fastq.gzXXX_2.fastq.gzYYY_1.fastq.gzYYY_2.fastq.gzZZZ_1.fastq.gzZZZ_2.fastq.gz XXX, YYY, ZZZ はサンプル名、_1 と _2 はペアを表します。
Creating a platform of Ensembl genes. Download Subio Platform v1.24からは、Ensembl Genes GRCh38.p13バージョンのPlatformがインストーラーにバンドルされています。それ以前のバージョンからお使いのユーザーは、このムービーを見ながらご自身でPlatformを作成してください。 このチュートリアルは、...
Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、 fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...
これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...
これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...
TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...
TCGA の miRNA-Seq データを解析する。(AMLの例) Download Subio Platformを使うと、TCGAのmiRNA-Seqのデータを簡単にインポートして、解析することができます。AMLのデータの解析例をご覧ください。
integrate multi-omics data sets Download このデモでは、擬似的なトランスクリプトミクス、プロテオミクス、メタボロミクスのデータセットを統合し、Subio Platform の Pathway View にまとめて表示する方法をご紹介します。 やり方は二通りあります。 元のIDを保持したまま、Platformを統合する 元のIDは使わず、Gene ID...
RNA-Seqのデータ(Counts / TPM / FPKM / RPKM)をインポートする。 Download 1:50 より前 ; RNA-Seq データ(Counts/FPKM/RPKM)のインポート 1:50 より後 ; 遺伝子アノテーションのインポート 関連トピック RNA-SeqのFASTQファイル処理
miRNAとターゲット遺伝子で、発現パターンが逆向きのペアを検索する。 Download Find miRNA Targets ツールは、遺伝子とmiRNAの実験データが対でそろっている場合に使えます。ここでは、実験的に検証されたmiRNAとターゲット遺伝子のペアや、計算によって予測されたmiRNAとターゲット遺伝子のペアのうち、発現パターンが逆相関になっているものを抽出します。すべてのペ...
RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...