• Subio Platform×

どのバージョンのGTFを使えばいい?

  • Gene Expression
  • High-Throughput Sequencing
which version of the gtf file

EnsemblのFTPでは、最新版のGTFがcurrentという名前で提供されています。そして、よく見るとたくさんのバージョンがあって、どれでもダウンロード可能です。何かのツールの操作方法を学びながらやっていると、特定のバージョン番号を記述していたりしますが、それが最新版でないときもあります。どちらのバージョンを選択するのがいいのでしょうか?  これについては、どのバージョンでもいいと思いま...

オミクスデータ解析を学ぶ、効率的な方法とは?

Technologies and analysis layers

たとえば、授業や講習会でRNA-Seqやマイクロアレイのデータ解析を学ぶとします。ほとんどの場合、解析必要なツールやデータを揃えてセットアップしたり、生データを処理するところから始まります。そこからデータ処理をして、統計解析、生物学的解釈と進んでいくでしょう。いちばん大事なのは最後の生物学的解釈のところなのですが、ここにはあまり時間が割かれません。その前のたいして重要でもないところに多くの時...

実際のところ、Single Cell RNA-Seq データの品質ってどうなの?

  • Gene Expression
  • High-Throughput Sequencing
scRNA-Seq Scatter Plot

GSE164898 は、10X Genomics のプロトコルで測定されたデータです。組織から数千の細胞に分けて、細胞ごとの発現量を出してくれるそうですが、1細胞あたりのリード数は数万程度しかありません。 RNA-Seqのダイナミックレンジはリード数に依存します。リード数が数万しかなければ、非常に発現が高い数十個の遺伝子の発現量しか捉えられないだろうと予想されます。それでは、実際にデータを見...

microRNA の発現データには要注意

  • Gene Expression
  • miRNA Expression
  • Microarray
  • High-Throughput Sequencing
miRNA - comparing data sets

遺伝子の発現量を測定する技術は、少なくとも2004年までには現在の水準に達していますので、ちゃんとしたスキルを持つ実験者により測定されたデータであれば、信頼できると言えます。一方で、マイクロRNAの発現量の測定は今なお難しいです。miRNAの発現データが、遺伝子発現データと同等に信頼できるものではないということは知っておいたほうが良いでしょう。ここでは、hepatocellular carc...

発現データの探索的解析(例:TCGA-BLCA)

  • Gene Expression
  • High-Throughput Sequencing
an exploratory analysis on TCGA-BLCA

オミクスデータの解析は、標準的なワークフローに従ってできるようなものではありません。実際の解析は(1)データを見て、(2)何かを見つけて、(3)見つけたことを検証する、という過程を繰り返すサイクルのようなものです。 (1)データを見る:  オミクスデータは、先入観なしに見なければなりません。なぜなら、大きなデータセットには必ず非線形のバイアスや人工的な影響が紛れ込んでいるからです。教科書のよ...

遺伝子とエクソンの発現アレイデータの比較

  • Gene Expression
  • Microarray
  • Exon Expression

GSE32006 は、アジレントの遺伝子発現マクロアレイと、エクソンアレイの二つのサブセットから構成されています。hg19のゲノムをロードして、Genome Viewで見ると、遺伝子発現のプローブと、エクソン発現のプローブの位置と、それらの測定したシグナル値を見ることができます。 GSE32006の解析データ (SOAファイル)。Subio Platformにインポートすると詳しくご覧いただ...

遺伝子発現マイクロアレイ: 1色法か、2色法か?

  • Gene Expression
  • Microarray
1c vs 2c

アジレントのマイクロアレイは、1色法または2色法の実験デザインが可能ですが、あなたの研究にはどちらを選ぶのがよいでしょうか? GSE27183 は1色法と2色法を同時に行っているので、参考になるでしょう。 1色法のメリット コストが安い 実験デザインが柔軟で、複雑な研究も可能 2色法のメリット 1色法で2サンプルを比較するより、発現差を検出する点において感度と精度が高い。ただしこれは、2つの...

マウス乳腺発達に関するふたつの独立した研究データの比較

  • Gene Expression
  • Microarray
Compare Two Independent Series of Mouse Mammary Gland Development

下記の二つの Series は、マウスの乳腺の発達をおったタイムコースの実験データです。この二つの研究はそれぞれどくりつしておこなわれたものですが、結果はみごとな一致を見せています。 Scan genes over series ツールを使うと、このような発見が簡単にできるようになります。 Data Source: https://www.ncbi.nlm.nih.gov/geo/quer...