• Normalization×

メチル化データ解析チュートリアル

Methylation Data Analysis Tutorial Thumbnail

これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...

マイクロアレイデータ解析の「実践的」チュートリアル

GSE97918

このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...

RNA-Seq データ解析の「実践的」チュートリアル

RNA-Seq Data Analysis Tutorial

このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...

RNA-Seq データ解析のための、正規化のプリセット・シナリオの解説

An RNA-Seq data analysis procedure, slightly different from microarrays'.

これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...

TCGAのDNAメチル化データをインポートして解析する。

TCGA のメチル化データをインポートする。 Download Subio Platform v1.20.5031 では、GDC (TCGAプロジェクトデータの提供サイト) から、さまざまながんにおけるDNAメチル化データを自動的にダウンロードする機能を搭載しました。どなたでも簡単にこれらのデータ解析を始めらることができます。 データインポートから解析まで一通り学びたい方は、オンライントレ...

TCGAのRNA-Seqデータをインポートする

Importing RNA-Seq data of TCGA

TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...

既に対数になっているデータをインポートした時は、どのように扱えばいいですか?

Import Log Ratio Data

既に対数に変換されているデータ(対数に変換されたシグナル値の場合と、そこからさらに対数比になっているの場合があります)をお持ちで、そのデータを Subio Platform 閲覧・解析したいという場合は、Normalizationタブで  Take as Log Scale  ブロックを最初に適用してください。これにより、Subio Platformがそのデータを対数とみなすようになります。...

Paired T-test で解析するにはどうすればいいですか?

Paired T-test

患者さんのデータを解析するとき、個体差が大きくて知りたい要因の効果を検出することが難しいことがよくあります。もし、同じ患者さんから比較可能な2種類のサンプルを取れるなら、そうすることで検出力が大きく向上させられる可能性があります。というのは、それぞれの患者さんにおけるコントロールと比較対象の差を取り出すことができますので、その差の平均値と分散を解析することで、個体差に惑わされることなく調べた...

ノーマライズを編集する

Editing Normalization

多くの人が気づいていないようなのですが、正規化と前処理はデータ解析において最も重要な部分です。複雑なデータに隠れた知識を読み出せるようにするステップだからです。 次の項目はデータの特徴に大きな影響を与えます。 測定装置・試薬キット・研究所・実験日  RNA-Seqの場合、総リード数・RNAのインプット量・品質 細胞や組織の種類・細胞の選別の有無 生検か保存試料か培養細胞か 成育条件・感染やコ...

エクセルのデータを Subio Platform にインポートする

Importing A Data Set from Excel.

もしエクセルで発現データをお持ちでしたら、下のチュートリアルムービーのようにSubio Platformでそのデータを視覚化・解析することができます。 エクセルのデータは、基本的に3つの部分からなっています。 遺伝子アノテーション 発現シグナル サンプル情報 このムービーでは、これらのパートを別々に分けて、それぞれ、(1)Platformの作成、(2)Sampleのインポート、(3)Samp...

ノーマライズ: Fill Missing Values ブロックの使い方

movie_thumnails_fillmissingvalues

Fill Missing Values ブロックの使い方 Download Fill Missing Value を使う必要のあるデータは、その扱い方に少しクセがあるということです。特に次世代シーケンサーを使ったRNA-Seq、ChIP-Seqなどのデータや質量分析で測定したプロテオミクスデータなどには、原理的にたくさんの欠損値、または '0' が含まれています。このムービーでは、そのよう...

RNA-Seq のBAMファイルをSubio Platformにインポートして見る

Importing RNA-seq Data (Illumina GA, BAM format)

RNA-Seq のデータを遺伝子単位で数値化したFPKMでしかみていない方が多いと思いますが、そのひとつ前のマッピングが終わったBAMファイルの段階でデータを視覚化すると、もっと多くの情報を引き出せるかも知れません。遺伝子単位でまるめこんだ発現量のデータなら、感度・精度ともにアジレントのマイクロアレイに敵わないかもしれません、しかし、RNA-Seqの醍醐味がマイクロアレイでは見えないものをみ...