FASTQファイルの処理中に起こるエラーの回避方法
fastpは、通常使われるアダプター配列に対応しておりますが、特殊なキットを使っている場合にアダプター配列を認識できないことがあります。その場合は、fastpのオプション設定欄で --adapter_sequence=AGATCGGAAGAGCACACGTCTGAACTCCAGTCA のようアダプター配列を教えてあげてください。 また、アダプターを取り除いた後のリード配列も、ターゲット以外の...
fastpは、通常使われるアダプター配列に対応しておりますが、特殊なキットを使っている場合にアダプター配列を認識できないことがあります。その場合は、fastpのオプション設定欄で --adapter_sequence=AGATCGGAAGAGCACACGTCTGAACTCCAGTCA のようアダプター配列を教えてあげてください。 また、アダプターを取り除いた後のリード配列も、ターゲット以外の...
このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...
bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする Download bigWigファイルはサイズが巨大なことが多く、そのままインポートするとSubio Platformがオーバーフローしてしまいがちです。このムービーでは、ゲノム領域を絞ってデータをインポートすることで、データをうまく圧縮する方法を見つける方法を解説します。こうすることで、...
Subio Platform が正しくペア―ドエンドサンプルを見つけられないときは、FASTQファイルの名前を下のように付け直して下さい。 XXX_1.fastq.gzXXX_2.fastq.gzYYY_1.fastq.gzYYY_2.fastq.gzZZZ_1.fastq.gzZZZ_2.fastq.gz XXX, YYY, ZZZ はサンプル名、_1 と _2 はペアを表します。
Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、 fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...
これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...
これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
TCGA のメチル化データをインポートする。 Download Subio Platform v1.20.5031 では、GDC (TCGAプロジェクトデータの提供サイト) から、さまざまながんにおけるDNAメチル化データを自動的にダウンロードする機能を搭載しました。どなたでも簡単にこれらのデータ解析を始めらることができます。 データインポートから解析まで一通り学びたい方は、オンライントレ...
TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...
TCGA の miRNA-Seq データを解析する。(AMLの例) Download Subio Platformを使うと、TCGAのmiRNA-Seqのデータを簡単にインポートして、解析することができます。AMLのデータの解析例をご覧ください。
"Select Files"ボタンを押すと、ファイルチューザーが開きますが、Mac OSではここで一つのファイルしか選択することができません。しかし、その上の白い枠内には、複数のファイルを一度にドラッグ&ドロップしてセットすることができます。これは、Mac OSのみで起こることが知られています。
RNA-Seqのデータ(Counts / TPM / FPKM / RPKM)をインポートする。 Download 1:50 より前 ; RNA-Seq データ(Counts/FPKM/RPKM)のインポート 1:50 より後 ; 遺伝子アノテーションのインポート 関連トピック RNA-SeqのFASTQファイル処理
アジレントのマイクロアレイデータをインポートする。 Download 00:00 - 01:401色法のデータをインポートする 01:40 - 02:452色法のデータをインポートする 02:45 - 2色法のデータをインポートする(dye swap デザインの場合)
TACソフトウェアを使ってCELファイルを処理し、そこからエクスポートしたSignal値と遺伝子アノテーションを、Subio Platformにインポートする。 Download Subio Platformは、GeneChipのCELファイルを直接扱うことができません。そこで、Thermo Fisher Scientificのウェブサイトから無料で入手できるTranscriptome A...
はい、GEO の Series レコードから、 SOFT format family ファイルをダウンロードして、Subio Platformにインポートしてください。同じGSEのSOFTファイルから、Platformの作成も、実験データのインポートもできます。 ただし、次世代シーケンサーのデータはSOFTファイルの中に入っていません。このようなGSEを再解析したい場合は、もしSupplem...
もしエクセルで発現データをお持ちでしたら、下のチュートリアルムービーのようにSubio Platformでそのデータを視覚化・解析することができます。 エクセルのデータは、基本的に3つの部分からなっています。 遺伝子アノテーション 発現シグナル サンプル情報 このムービーでは、これらのパートを別々に分けて、それぞれ、(1)Platformの作成、(2)Sampleのインポート、(3)Samp...
RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...