• Group Comparison×

P値は、生物学にとってそれほど重要ではない

  • Gene Expression
  • Microarray
  • High-Throughput Sequencing
Statistics

経験の浅い人ほどP値を過信する傾向がありますが、P値を上手に使うためにはバランスの取れた視点が必要です。P値は物差しの一つでしかありません。 まず、P値とは何かを正確に知るべきです。統計学的有意であることと、生物学的有意であることの間には、なんの関係もありません。下記のStatementをよくご覧ください。 AMERICAN STATISTICAL ASSOCIATION RELEASES ...

発現データの探索的解析(例:TCGA-BLCA)

  • Gene Expression
  • High-Throughput Sequencing
an exploratory analysis on TCGA-BLCA

オミクスデータの解析は、標準的なワークフローに従ってできるようなものではありません。実際の解析は(1)データを見て、(2)何かを見つけて、(3)見つけたことを検証する、という過程を繰り返すサイクルのようなものです。 (1)データを見る:  オミクスデータは、先入観なしに見なければなりません。なぜなら、大きなデータセットには必ず非線形のバイアスや人工的な影響が紛れ込んでいるからです。教科書のよ...

T検定がなぜ理論的には使えないのか、そして、それでもなぜ実用には使えるのか

  • Gene Expression
  • Microarray
  • High-Throughput Sequencing
  • Exon Expression
  • miRNA Expression
Why t-test doesn't work theoretically

ほとんどの方が発現差のある遺伝子群(DEGs)、つまりあるグループで高発現していて、もう片方のグループで低発現しているパターンを示す遺伝子群を探そうとします。しかし、このような遺伝子が原因遺伝子であるのは、下記のモデルのうち single factor model でしかなく、これは高度に複雑な生物現象の中では極めて稀だと思います。それ以外の下記のようなシンプルなモデルにおいて、遺伝子発現が...

TCGA PRAD の RNA-Seq と miRNA-Seq データの統合解析

  • Gene Expression
  • miRNA Expression
  • High-Throughput Sequencing
TCGA PRAD Integrated Analysis of RNA seq and miRNA seq (part 2)

The Cancer Genome Atlas (TCGA) は、がんに関するマルチオミクスデータとクリニカル情報の大量に蓄積しているサイトです。 このケーススタディでは、normal と tumor のグループ間で発現差のある遺伝子(DEGs)を抽出し(part 1)、発現を制御している可能性のあるmiRNAの抽出を行います(part 2)。ただし、下記のムービーで見るものより、TCGAの...