• Data Browsing×

TPM/FPKM/RPKMを過度に信用してはいけない。RNA-Seqデータの系統誤差を除去できているとは限らない。

  • Microarray
  • High-Throughput Sequencing
  • Gene Expression
  • Exon Expression
  • miRNA Expression
GSE159751_1_histogram

RNA-Seqによる発現データの解析には、リードカウントではなくTPM、FPKM、またはRPKMを用いるべきだと信じている人が多いです。その理由の一つに、サンプル間の系統誤差を回避することがあげられます。しかし、100万リードあたりで均すやり方は、一種のグローバルノーマライズに過ぎず、これで除去できるのは線形の系統誤差だけです。これは、現実のオミクスデータ解析に対して甘すぎる前提と言わざるを...

実際のところ、Single Cell RNA-Seq データの品質ってどうなの?

  • Gene Expression
  • High-Throughput Sequencing
scRNA-Seq Scatter Plot

GSE164898 は、10X Genomics のプロトコルで測定されたデータです。組織から数千の細胞に分けて、細胞ごとの発現量を出してくれるそうですが、1細胞あたりのリード数は数万程度しかありません。 RNA-Seqのダイナミックレンジはリード数に依存します。リード数が数万しかなければ、非常に発現が高い数十個の遺伝子の発現量しか捉えられないだろうと予想されます。それでは、実際にデータを見...

なぜ bulk RNA-Seq の解析にはPCA、シングルセルRNA-Seqの解析には t-SNE が使われるのか?

  • High-Throughput Sequencing
  • Gene Expression
FAQ

t-SNE がシングルセルRNA-Seqのデータ解析でよく使われるようになっています。しかし、「なぜbulk RNA-SeqにはPCAで、scRNA-Seqにはt-SNEか」という説明をいくら読んでも、個人的には納得できる説明が見当たりません。 高次元のデータを可視化するt-SNEの効果的な使い方 という説明が t-SNE とは何かを知るのに最適だと思いますので、ここで述べられている特徴を見...

TCGA PRAD の RNA-Seq と miRNA-Seq データの統合解析

  • Gene Expression
  • miRNA Expression
  • High-Throughput Sequencing
TCGA PRAD Integrated Analysis of RNA seq and miRNA seq (part 2)

The Cancer Genome Atlas (TCGA) は、がんに関するマルチオミクスデータとクリニカル情報の大量に蓄積しているサイトです。 このケーススタディでは、normal と tumor のグループ間で発現差のある遺伝子(DEGs)を抽出し(part 1)、発現を制御している可能性のあるmiRNAの抽出を行います(part 2)。ただし、下記のムービーで見るものより、TCGAの...

遺伝子とエクソンの発現アレイデータの比較

  • Gene Expression
  • Microarray
  • Exon Expression

GSE32006 は、アジレントの遺伝子発現マクロアレイと、エクソンアレイの二つのサブセットから構成されています。hg19のゲノムをロードして、Genome Viewで見ると、遺伝子発現のプローブと、エクソン発現のプローブの位置と、それらの測定したシグナル値を見ることができます。 GSE32006の解析データ (SOAファイル)。Subio Platformにインポートすると詳しくご覧いただ...

遺伝子発現マイクロアレイ: 1色法か、2色法か?

  • Gene Expression
  • Microarray
1c vs 2c

アジレントのマイクロアレイは、1色法または2色法の実験デザインが可能ですが、あなたの研究にはどちらを選ぶのがよいでしょうか? GSE27183 は1色法と2色法を同時に行っているので、参考になるでしょう。 1色法のメリット コストが安い 実験デザインが柔軟で、複雑な研究も可能 2色法のメリット 1色法で2サンプルを比較するより、発現差を検出する点において感度と精度が高い。ただしこれは、2つの...

マウス乳腺発達に関するふたつの独立した研究データの比較

  • Gene Expression
  • Microarray
Compare Two Independent Series of Mouse Mammary Gland Development

下記の二つの Series は、マウスの乳腺の発達をおったタイムコースの実験データです。この二つの研究はそれぞれどくりつしておこなわれたものですが、結果はみごとな一致を見せています。 Scan genes over series ツールを使うと、このような発見が簡単にできるようになります。 Data Source: https://www.ncbi.nlm.nih.gov/geo/quer...