発現データの探索的解析(例:TCGA-BLCA)

  • Gene Expression
  • High-Throughput Sequencing
an exploratory analysis on TCGA-BLCA

オミクスデータの解析は、標準的なワークフローに従ってできるようなものではありません。実際の解析は(1)データを見て、(2)何かを見つけて、(3)見つけたことを検証する、という過程を繰り返すサイクルのようなものです。 (1)データを見る:  オミクスデータは、先入観なしに見なければなりません。なぜなら、大きなデータセットには必ず非線形のバイアスや人工的な影響が紛れ込んでいるからです。教科書のよ...

T検定がなぜ理論的には使えないのか、そして、それでもなぜ実用には使えるのか

  • Gene Expression
  • Microarray
  • High-Throughput Sequencing
  • Exon Expression
  • miRNA Expression
Why t-test doesn't work theoretically

ほとんどの方が発現差のある遺伝子群(DEGs)、つまりあるグループで高発現していて、もう片方のグループで低発現しているパターンを示す遺伝子群を探そうとします。しかし、このような遺伝子が原因遺伝子であるのは、下記のモデルのうち single factor model でしかなく、これは高度に複雑な生物現象の中では極めて稀だと思います。それ以外の下記のようなシンプルなモデルにおいて、遺伝子発現が...

TCGA PRAD の RNA-Seq と miRNA-Seq データの統合解析

  • Gene Expression
  • miRNA Expression
  • High-Throughput Sequencing
TCGA PRAD Integrated Analysis of RNA seq and miRNA seq (part 2)

The Cancer Genome Atlas (TCGA) は、がんに関するマルチオミクスデータとクリニカル情報の大量に蓄積しているサイトです。 このケーススタディでは、normal と tumor のグループ間で発現差のある遺伝子(DEGs)を抽出し(part 1)、発現を制御している可能性のあるmiRNAの抽出を行います(part 2)。ただし、下記のムービーで見るものより、TCGAの...

RNA-Seq データの品質は RNA の量に依存する

  • Gene Expression
  • High-Throughput Sequencing
Thumbnail Viewing Quartz Seq Data (Gse42268)

GSE42268は、さまざまな量のインプットRNAが含まれるデータセットです。そこで、インプットの量がRNA-Seqのデータの品質にどのような影響があるかを見てみました。 いちばん上は、1ug の total RNA を測定した結果です。値はFPKMなのでノイズとシグナルの境目がぼやけて見難くはなっていますが、だいたい 0.1 ~ 1 の間に境があるようです。たとえば 0.5 以上を信頼で...

遺伝子とエクソンの発現アレイデータの比較

  • Gene Expression
  • Microarray
  • Exon Expression

GSE32006 は、アジレントの遺伝子発現マクロアレイと、エクソンアレイの二つのサブセットから構成されています。hg19のゲノムをロードして、Genome Viewで見ると、遺伝子発現のプローブと、エクソン発現のプローブの位置と、それらの測定したシグナル値を見ることができます。 GSE32006の解析データ (SOAファイル)。Subio Platformにインポートすると詳しくご覧いただ...

遺伝子発現マイクロアレイ: 1色法か、2色法か?

  • Gene Expression
  • Microarray
1c vs 2c

アジレントのマイクロアレイは、1色法または2色法の実験デザインが可能ですが、あなたの研究にはどちらを選ぶのがよいでしょうか? GSE27183 は1色法と2色法を同時に行っているので、参考になるでしょう。 1色法のメリット コストが安い 実験デザインが柔軟で、複雑な研究も可能 2色法のメリット 1色法で2サンプルを比較するより、発現差を検出する点において感度と精度が高い。ただしこれは、2つの...