• High-Throughput Sequencing×

メチル化データ解析チュートリアル

Methylation Data Analysis Tutorial Thumbnail

これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...

HISAT2インデックスがウェブから提供されていないとき、インデックスを自分で作る方法

Trouble Shooting

もしHISAT2のインデックスファイルがウェブサイトから提供されていなければ、その生物種のインデックスはご自身で作る必要があります。この解説は、Linux や Unix のコマンド操作に慣れていない方を想定しています。 Windowsユーザーだけが必要な準備 WindowsでLinuxシステム用に作られたバイオインフォマティクスツールを使用するために、WSLを導入したと思います。この場合、イ...

適切な生物種・ゲノムバージョンのGTFファイルを、Ensembl FTPサイトから取得する方法

FAQ

RNA-Seq FASTQファイル処理のパイプラインを設定するには、適切なHISAT2インデックスとGTFファイルを入手する必要があります。異なる生物種のものを使用したり、HISAT2インデックスとGTFのゲノムバージョンが不一致であったりしても、誤って正常に実行が完了してしまいます。そのため、パイプラインを実行する前に、これらのファイルが正しく選択されていることを確認してください。 提供さ...

FASTQファイルの処理中に起こるエラーの回避方法

Trouble Shooting

fastpは、通常使われるアダプター配列に対応しておりますが、特殊なキットを使っている場合にアダプター配列を認識できないことがあります。その場合は、fastpのオプション設定欄で --adapter_sequence=AGATCGGAAGAGCACACGTCTGAACTCCAGTCA のようアダプター配列を教えてあげてください。 また、アダプターを取り除いた後のリード配列も、ターゲット以外の...

変異データ解析チュートリアル(RNA-Seq の FASTQ ファイルから)

Aggregate Variants per Gene

特にWindowsをお使いの方にとっては、RNA-SeqのFASTQファイルから GATKを使って変異を検出するもっとも簡単な方法だと思います。そして、たとえば Normal vs. Disease のような実験において、Disease で多く見られる変異、あるいはDiseaseで変異の多い遺伝子をもっとも簡単に抽出することができるツールでしょう。 RNA-SeqのFASTQファイルから、ゲ...

bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする

Importing Bigwig

bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする Download bigWigファイルはサイズが巨大なことが多く、そのままインポートするとSubio Platformがオーバーフローしてしまいがちです。このムービーでは、ゲノム領域を絞ってデータをインポートすることで、データをうまく圧縮する方法を見つける方法を解説します。こうすることで、...

.fastq.gz ファイルを Gene Expression Omnibus (GEO) から入手する方法

FAQ

GSEからFASTQファイルをダウンロードする場合、サンプルごとに一つ一つダウンロードしなくてはいけないので、かなり面倒ですが、複数の画面を使って同時に実行するとよいでしょう。 手順 1. GEOのウェブサイトで GSM record のページを開く。2. ページの下までスクロールすると、対応するSRXへリンクがあるので、これをクリックする。3. シーケンスリードに関する情報、特にそれが S...

Aggregate Variants per Exon ツール、および Filter by Exon ツールの使い方

Aggregate Variants per Exon

ターゲット遺伝子のエクソンごとに変異を集計する。特定のエクソン上の変異を抽出する。 Download このツールは、Aggregate Variants や Aggregate Variants per Gene ツールで解析した後に使用してください。対象遺伝子の候補をリストアップした後、候補ごとにエクソンごとに要約することができます。 また、エクソンによるフィルタツールは、指定された転写...

Aggregate Variants per Gene ツールの使い方

Aggregate Variants per Gene

遺伝子ごとに変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグル...

Aggregate Variant ツールの使い方

Aggregate Variants

変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグループにおける...

FASTQ to VCF (RNA-Seq) の実行環境を設定する方法(Windows バージョン)

FASTQ to VCF(RNA-Seq) Environment Set-up Panel (windows 10)

この記事は、FASTQ to VCF ツールを使うための準備のためのものです。 これを始める前に これを始める前に、必ずRNA-Seq FASTQファイル処理パイプラインの設定のやり方(Windows 版)を完了してください。fastp と  HISAT2  は同じなので、ここでは説明を省きます。ここでは、追加の  GATK4 のインストールについて説明します。 環境設定パネル 設定のやり方...

FASTQ to VCF (RNA-Seq) の実行環境を設定する方法(macOS バージョン)

FASTQ to VCF (RNA-Seq) Environment Set-up Panel (macOS)

この記事は、FASTQ to VCF ツールを使うための準備を行うためのものです。 GATK4のインストール これを始める前に、RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)を完了してください。ここで説明されている fastp と HISAT2 の設定は同じなので、ここでは省略します。これらに加え、bioconda経由で GATK4 をインストールします。...

RNA-Seq FASTQファイル処理の実行のしかた ~ Subio Platformへのデータインポート

Fastq Processing

Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、  fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...

RNA-Seq FASTQファイル処理パイプラインの設定のやり方(Windows 版)

Prep Win

これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...

RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)

Prep Mac

これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...

RNA-Seq データ解析の「実践的」チュートリアル

RNA-Seq Data Analysis Tutorial

このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...

RNA-Seq データ解析のための、正規化のプリセット・シナリオの解説

An RNA-Seq data analysis procedure, slightly different from microarrays'.

これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...

TCGAのRNA-Seqデータをインポートする

Importing RNA-Seq data of TCGA

TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...

Find miRNA Targets の使い方

Find miRNA Targets

miRNAとターゲット遺伝子で、発現パターンが逆向きのペアを検索する。 Download Find miRNA Targets ツールは、遺伝子とmiRNAの実験データが対でそろっている場合に使えます。ここでは、実験的に検証されたmiRNAとターゲット遺伝子のペアや、計算によって予測されたmiRNAとターゲット遺伝子のペアのうち、発現パターンが逆相関になっているものを抽出します。すべてのペ...

RNA-Seq のBAMファイルをSubio Platformにインポートして見る

Importing RNA-seq Data (Illumina GA, BAM format)

RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...