• Exon Expression×

TPM/FPKM/RPKMを過度に信用してはいけない。RNA-Seqデータの系統誤差を除去できているとは限らない。

  • Microarray
  • High-Throughput Sequencing
  • Gene Expression
  • Exon Expression
  • miRNA Expression
GSE159751_1_histogram

RNA-Seqによる発現データの解析には、リードカウントではなくTPM、FPKM、またはRPKMを用いるべきだと信じている人が多いです。その理由の一つに、サンプル間の系統誤差を回避することがあげられます。しかし、100万リードあたりで均すやり方は、一種のグローバルノーマライズに過ぎず、これで除去できるのは線形の系統誤差だけです。これは、現実のオミクスデータ解析に対して甘すぎる前提と言わざるを...

オミクス実験は、非線形バイアスの問題を逃れられない

  • Microarray
  • High-Throughput Sequencing
  • Gene Expression
  • Exon Expression
  • miRNA Expression
Trouble Shooting

オミクスデータは、実験日、実験者、実験室、機械、試薬またはもっと微妙な何かの差の影響を敏感に受けます。 従って、オミクスデータは純粋に真実を反映しているのではなく、何らかの非線形系統誤差が必ずかかっているものと見做すべきです。 比較(あるいは解析)可能なのは、同質の系統誤差がかかっている(以降、"同じタイプ" と言う)のサンプルの間だけで、異質の系統誤差のかかった(以降、"異なるタイプ" と...

良い研究は、優れた実験計画から。

  • Microarray
  • High-Throughput Sequencing
  • Gene Expression
  • Exon Expression
  • miRNA Expression
Trouble Shooting

1. 実験区とN数の割り当てこそ、工夫のしどころです。 予算・時間・人員が無尽蔵に使えるのであれば、理論上最適な実験計画を策定すれば済むことなのですが、現実世界には様々な制約があります。 マイクロアレイやRNA-Seqでいちばんネックとなるのは予算でしょう。 統計学が想定するサンプル数に対してオミクス実験のサンプル数は少な過ぎるので、統計学的要求に闇雲に従うのは無意味です。 私たちの解析経験...

T検定がなぜ理論的には使えないのか、そして、それでもなぜ実用には使えるのか

  • Gene Expression
  • Microarray
  • High-Throughput Sequencing
  • Exon Expression
  • miRNA Expression
Why t-test doesn't work theoretically

ほとんどの方が発現差のある遺伝子群(DEGs)、つまりあるグループで高発現していて、もう片方のグループで低発現しているパターンを示す遺伝子群を探そうとします。しかし、このような遺伝子が原因遺伝子であるのは、下記のモデルのうち single factor model でしかなく、これは高度に複雑な生物現象の中では極めて稀だと思います。それ以外の下記のようなシンプルなモデルにおいて、遺伝子発現が...

遺伝子とエクソンの発現アレイデータの比較

  • Gene Expression
  • Microarray
  • Exon Expression

GSE32006 は、アジレントの遺伝子発現マクロアレイと、エクソンアレイの二つのサブセットから構成されています。hg19のゲノムをロードして、Genome Viewで見ると、遺伝子発現のプローブと、エクソン発現のプローブの位置と、それらの測定したシグナル値を見ることができます。 GSE32006の解析データ (SOAファイル)。Subio Platformにインポートすると詳しくご覧いただ...