メチル化データ解析チュートリアル
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...
TCGA のメチル化データをインポートする。 Download Subio Platform v1.20.5031 では、GDC (TCGAプロジェクトデータの提供サイト) から、さまざまながんにおけるDNAメチル化データを自動的にダウンロードする機能を搭載しました。どなたでも簡単にこれらのデータ解析を始めらることができます。 データインポートから解析まで一通り学びたい方は、オンライントレ...
TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...
TCGA の miRNA-Seq データを解析する。(AMLの例) Download Subio Platformを使うと、TCGAのmiRNA-Seqのデータを簡単にインポートして、解析することができます。AMLのデータの解析例をご覧ください。
integrate multi-omics data sets Download このデモでは、擬似的なトランスクリプトミクス、プロテオミクス、メタボロミクスのデータセットを統合し、Subio Platform の Pathway View にまとめて表示する方法をご紹介します。 やり方は二通りあります。 元のIDを保持したまま、Platformを統合する 元のIDは使わず、Gene ID...
既に対数に変換されているデータ(対数に変換されたシグナル値の場合と、そこからさらに対数比になっているの場合があります)をお持ちで、そのデータを Subio Platform 閲覧・解析したいという場合は、Normalizationタブで Take as Log Scale ブロックを最初に適用してください。これにより、Subio Platformがそのデータを対数とみなすようになります。...
患者さんのデータを解析するとき、個体差が大きくて知りたい要因の効果を検出することが難しいことがよくあります。もし、同じ患者さんから比較可能な2種類のサンプルを取れるなら、そうすることで検出力が大きく向上させられる可能性があります。というのは、それぞれの患者さんにおけるコントロールと比較対象の差を取り出すことができますので、その差の平均値と分散を解析することで、個体差に惑わされることなく調べた...
多くの人が気づいていないようなのですが、正規化と前処理はデータ解析において最も重要な部分です。複雑なデータに隠れた知識を読み出せるようにするステップだからです。 次の項目はデータの特徴に大きな影響を与えます。 測定装置・試薬キット・研究所・実験日 RNA-Seqの場合、総リード数・RNAのインプット量・品質 細胞や組織の種類・細胞の選別の有無 生検か保存試料か培養細胞か 成育条件・感染やコ...
もしエクセルで発現データをお持ちでしたら、下のチュートリアルムービーのようにSubio Platformでそのデータを視覚化・解析することができます。 エクセルのデータは、基本的に3つの部分からなっています。 遺伝子アノテーション 発現シグナル サンプル情報 このムービーでは、これらのパートを別々に分けて、それぞれ、(1)Platformの作成、(2)Sampleのインポート、(3)Samp...
Fill Missing Values ブロックの使い方 Download Fill Missing Value を使う必要のあるデータは、その扱い方に少しクセがあるということです。特に次世代シーケンサーを使ったRNA-Seq、ChIP-Seqなどのデータや質量分析で測定したプロテオミクスデータなどには、原理的にたくさんの欠損値、または '0' が含まれています。このムービーでは、そのよう...
RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...