メチル化データ解析チュートリアル
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
これからご紹介する方法は、Illuminaのどのメチル化アレイにも適用できるのはもちろん、シーケンサーなど別のテクノロジーを使って測定したデータにも幅広く応用できます。ポイントとなるのは、膨大なメチル化サイトを二つのカテゴリー、つまりプロモーター領域とそれ以外に分けることです。プロモーター領域と CpGアイランドは重複していることが多いですが、完全に一致するものではありません。ヒトの遺伝子の...
RNA-Seq FASTQファイル処理のパイプラインを設定するには、適切なHISAT2インデックスとGTFファイルを入手する必要があります。異なる生物種のものを使用したり、HISAT2インデックスとGTFのゲノムバージョンが不一致であったりしても、誤って正常に実行が完了してしまいます。そのため、パイプラインを実行する前に、これらのファイルが正しく選択されていることを確認してください。 提供さ...
特にWindowsをお使いの方にとっては、RNA-SeqのFASTQファイルから GATKを使って変異を検出するもっとも簡単な方法だと思います。そして、たとえば Normal vs. Disease のような実験において、Disease で多く見られる変異、あるいはDiseaseで変異の多い遺伝子をもっとも簡単に抽出することができるツールでしょう。 RNA-SeqのFASTQファイルから、ゲ...
このチュートリアルは、ウェットの生物学・医学・農学系研究者がマイクロアレイのデータ解析を学習することを想定し、データの取得から生物学的解釈まで一通りの流れを解説したものです。マイクロアレイのデータ解析についてよく知らない人ほど、正しい解析方法というものがあって、正しく解析された結果を取得したいと考える傾向があります。GSE97918は、データ解析がそのようなものではないということを学べる良い...
bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする Download bigWigファイルはサイズが巨大なことが多く、そのままインポートするとSubio Platformがオーバーフローしてしまいがちです。このムービーでは、ゲノム領域を絞ってデータをインポートすることで、データをうまく圧縮する方法を見つける方法を解説します。こうすることで、...
GSEからFASTQファイルをダウンロードする場合、サンプルごとに一つ一つダウンロードしなくてはいけないので、かなり面倒ですが、複数の画面を使って同時に実行するとよいでしょう。 手順 1. GEOのウェブサイトで GSM record のページを開く。2. ページの下までスクロールすると、対応するSRXへリンクがあるので、これをクリックする。3. シーケンスリードに関する情報、特にそれが S...
ターゲット遺伝子のエクソンごとに変異を集計する。特定のエクソン上の変異を抽出する。 Download このツールは、Aggregate Variants や Aggregate Variants per Gene ツールで解析した後に使用してください。対象遺伝子の候補をリストアップした後、候補ごとにエクソンごとに要約することができます。 また、エクソンによるフィルタツールは、指定された転写...
遺伝子ごとに変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグル...
変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグループにおける...
Annotate VCF Download SnpEffは 変異に対してアノテーションとそれがもたらす効果を予測するツールです。 Annotate VCF ツールは、このプログラムを Subio Platform から簡単に実行できるようにするものです。
FASTQ to VCF (RNA-Seq) Download このパイプラインは、GATKのRNAseq short variant discovery (SNPs + Indels)を参考にして作っています。ただし、メモリーの消費量を抑えるため、アラインメントにはSTARではなくHISAT2を使っています。実行する前に、環境のセットアップを行ってください。
この記事は、FASTQ to VCF ツールを使うための準備のためのものです。 これを始める前に これを始める前に、必ずRNA-Seq FASTQファイル処理パイプラインの設定のやり方(Windows 版)を完了してください。fastp と HISAT2 は同じなので、ここでは説明を省きます。ここでは、追加の GATK4 のインストールについて説明します。 環境設定パネル 設定のやり方...
この記事は、FASTQ to VCF ツールを使うための準備を行うためのものです。 GATK4のインストール これを始める前に、RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)を完了してください。ここで説明されている fastp と HISAT2 の設定は同じなので、ここでは省略します。これらに加え、bioconda経由で GATK4 をインストールします。...
Creating a platform of Ensembl genes. Download Subio Platform v1.24からは、Ensembl Genes GRCh38.p13バージョンのPlatformがインストーラーにバンドルされています。それ以前のバージョンからお使いのユーザーは、このムービーを見ながらご自身でPlatformを作成してください。 このチュートリアルは、...
Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、 fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...
これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...
これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...
このチュートリアルは、生物学・医学・農学系研究者がRNA-Seqのデータ解析を学習することを想定し、発現量データ(数値のテキストファイル)のインポートから生物学的解釈まで一通りの流れを解説したものです。FASTQファイルから始める場合、FASTQから発現量を算出までのパイプラインを別のチュートリアルにまとめてありますのでそちらをご覧ください。 ここではSubio Platform という解析...
遺伝子リストから関連の示唆されるGOやパスウェイを検索する。 Download Enrichment Analysis tool は、抽出した遺伝子リストを生物学的コンテキストで解釈するのによく使われます。Gene Ontology (GO)はもちろんですが、パスウェイやサイトバンド、タンパクドメイン、miRNAのターゲットや転写因子のターゲット検索など、幅広い用途に使える便利なツールです...
TSS Plot Download TSS Plot ツールは、何らかの値とTSSからの相対距離の関係を視覚化するものです。 よくあるのは、転写調節因子の結合や、DNAまたはヒストンの就職などのイベントの数をヒストグラムで表した図です。Subio PaltformのTSS Plotでは、さらに、メチル化比率や、メチル化状態の上昇または減退といった変化、遺伝子発現パターンとメチル化状態の変化...
Import MSigDB Gene Sets / Find Measurement Lists or Pathways Download Molecular Signatures Database (MSigDB) は、GSEAソフトウェアで使用するアノテーションされた遺伝子セットのコレクションで、大きく8つに分類されます。 Hall mark gene sets, よく知られた生物学的...
複数のPlatformを跨るマルチオミクスデータの統合解析の準備をする。 Download このツールは、複数のオミックスデータセットを統合するために、さまざまなプラットフォームで共通のサンプルを見つけて印を付けます。このツールはFind miRNA Targets や Find Correlated Regions を使って解析を行うための準備を簡単に行えるようにするユーティリティです。...
Importing a gene list, or a set of lists. Download テキストファイルから、一つまたは複数の遺伝子リストをSubio Platformにインポートして、これらの遺伝子群の発現パターンを概観することができます。また、遺伝子リストをインポートすると、これらをエンリッチメント解析に利用できるようになります。 遺伝子のIDは、Platformに登録さ...
GO解析について Gene Ontology (GO) 解析でしたら、(1) DAVID Functional Annotation のウェブツールを使うか、(2) Advanced Plug-in に含まれる "Enrichment Analysis" ツールを使ってできます。さらに、後者は System Plug-in に含まれる "Import MSigDB Gene Sets" ツー...
検索の基本テクニック Download Subio Platform は高度な検索機能を提供しています。このチュートリアルでは検索機能を使いこなすためのノウハウを紹介します。これらのテクニックは他の検索パネルでも使えます。 正規表現 の詳しい文法は、グーグル検索してみてください。
これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...
Seriesをコピーしたり、変更したりする Download 大量のSampleやSeriesがある場合に、これらのユーティリティツールは非常に便利です。 Make A Copy of This Series は単純なツールです。しかし、Serieに変更を加える前にコピーしておくのは、安全に作業を進めるために必要です。 Add/Remove Samples は、Seriesから質の悪いSa...
選択した遺伝子の発現パターンを、Seriesを跨いで俯瞰する。 Download 大量のSeriesが、複数のPlatformやOrganismにまたがって存在する場合、一つ一つのSeriesを開いて見ていくのは非常に困難になります。 Scan genes over series ツールは、そのような時に鳥観図のような視座を提供してくれます。一つまたは二つの遺伝子名を入力するだけで、その遺...
カプランマイヤー生存曲線を描画する。 Download Kaplan-Meier Survival Curve Tool を使って、カプランマイヤー生存曲線を描画するための準備について解説します。 ある治療を実施したグループとそうでないグループに分けて生存率を比較するなどはこれまで沢山の報告があります。Subio Platformに蓄積されたオミクスデータを使えば、たとえば、特定の遺伝子が...
TCGA のメチル化データをインポートする。 Download Subio Platform v1.20.5031 では、GDC (TCGAプロジェクトデータの提供サイト) から、さまざまながんにおけるDNAメチル化データを自動的にダウンロードする機能を搭載しました。どなたでも簡単にこれらのデータ解析を始めらることができます。 データインポートから解析まで一通り学びたい方は、オンライントレ...
TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...
TCGA の miRNA-Seq データを解析する。(AMLの例) Download Subio Platformを使うと、TCGAのmiRNA-Seqのデータを簡単にインポートして、解析することができます。AMLのデータの解析例をご覧ください。
Edit Flag Columns パネルの使い方 Download Subio Platform ver. 1.20 から、Edit Flag Columns パネルがより使いやすくなりました。 データインポートから解析まで一通り学びたい方は、オンライントレーニングをお申し込みください。 関連トピック マイクロアレイのフラグ値とは?
2群間での発現差解析を、まとめて実行する。 Download 発現差のある遺伝子を、1対Nまたは総当たりの組み合わせでまとめて抽出することができます。大量の組み合わせがあるときにとても便利なツールです このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。 関連トピック T検定により発現差のある遺伝子を抽出する
PCAスコアをエクセルで再現する方法 Download このチュートリアルでは、Subio PlatformのScatter Plot (Samples) Viewで表示されているPCAスコアを、エクセル(あるいは他のソフトウェア)上で再現する手順をご紹介します。 この操作がよくわからないときは、無料オンラインサポートをお申し込みください。
Subio Platform & Plug-ins ユーザーガイド このマニュアルは、用語やコンセプトを理解するための補助的資料ですが、それ以上のものではありません。操作を学ぶのはムービーチュートリアルのほうが適しています。解析ガイド では、全体のワークフローが示されています。各ステップをクリックすると、それに関連するチュートリアルが表示されますので、これを見ながら進められる人は進め...
階層型クラスタリングのヒートマップを出力して、エクセルで見る。 Download Tree Viewで表示されているヒートマップをエクスポートして、エクセル上で表示することができます。 操作がよくわからない場合は、無料オンラインサポートをお申し込みください。
2群間で、統計学的有意に発現差のある遺伝子を抽出する。 Download Compare to Control ツールと Compare 2 Groups ツールは、Basic Plug-inの中でも Filter ツールの次に使用頻度が高いツールでしょう。Fold差や統計検定によって発現差がある遺伝子(DEG)を抽出し、Volcano Plot を描画します。検定は、one-sample...
フラグとは、マイクロアレイの測定システムが、測定値とあわせて出力するもので、その測定値の信頼性に関する指標となります。ただ、それぞれの測定システムや、フラグの種類によって意味や特徴がまったく異なりますので、その特徴を理解してフィルターを使うととても強力な解析ツールになります。 Affymetrix GeneChip: Affymetrix GeneChip で、MAS5で解析されたデータの場...
Subio Platformの最新版へのアップグレードは、いつでも無料で行えます。最新版の有無をチェックして、更新する操作をご覧ください。 このような半自動化プロセスはv 1.19以降でご利用いただけます。v 1.18またはそれ以前のバージョンをお使いの場合は、下記リンクよりアップデータを取得して、実行してください。 Download Updater Subio Platformをバージョン...
フィルターで、測定値の信頼できない遺伝子を除く。 Download 統計解析をする前に、解析にとってノイズとなる遺伝子を Filter ツールを使って除きましょう。具体的には、すべてのサンプルにおいてシグナルがノイズ領域から出ない遺伝子や、発現変動しない遺伝子を除きます。 このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。 0:10 ここで例として使うデ...
Annotations タブから1クリックでプローブシーケンスをBLASTしたい場合は、下記の定義文をWeb Linkに設定してください。 https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Put&QUERY=[SEQUENCE]&PROGRAM=blastn&FILTER=L&DATABASE=nr&A...
ツリークラスタリング:パターンの似た遺伝子グループを概観する。 Download 階層型クラスタリングは発現パターンの似ている遺伝子郡をグループにまとめたり、発現プロファイルの似ているサンプル群をグループにまとめたりして、全体像を大まかに把握するのに便利です。 00:00 Tree Clustering を実行する前に、下記のようなノイズとなる遺伝子群を除去する 値が低すぎて、測定値が信用...
integrate multi-omics data sets Download このデモでは、擬似的なトランスクリプトミクス、プロテオミクス、メタボロミクスのデータセットを統合し、Subio Platform の Pathway View にまとめて表示する方法をご紹介します。 やり方は二通りあります。 元のIDを保持したまま、Platformを統合する 元のIDは使わず、Gene ID...
Genome データは、Genome View や Chromosome タブでデータを視覚化するのに必要です。このムービーで、どのように UCSC ゲノムブラウザーのデータを使ってGenomeを作成するかご覧ください。 Genome を作成する。 Download Genomeは、Subio Platform上で仮想染色体を表示したり、選択したmeasurementの位置を仮想染色体上に表...
RNA-Seqのデータ(Counts / TPM / FPKM / RPKM)をインポートする。 Download 1:50 より前 ; RNA-Seq データ(Counts/FPKM/RPKM)のインポート 1:50 より後 ; 遺伝子アノテーションのインポート 関連トピック RNA-SeqのFASTQファイル処理
アジレントのマイクロアレイデータをインポートする。 Download 00:00 - 01:401色法のデータをインポートする 01:40 - 02:452色法のデータをインポートする 02:45 - 2色法のデータをインポートする(dye swap デザインの場合)
Create A Platform of An Agilent Microarray Download 遺伝子発現マイクロアレイをお使いの場合は、こちらのパートをご覧ください 0:00 eArray のサイトからアノテーションファイルをダウンロードする 1:00 アノテーションファイルをインポートして、Platform を作成する 1:20 gene symbol 列をセットする 1:30...
Create A Platform of An Affymetrix Gene Chip Download 0:00 Affymetrix のウェブサイトから、CSV 形式の annotation ファイルをダウンロードする 0:30 拡張子を .csv から .txt に変更する 0:45 エクセルで開いてタブ区切りテキスト形式のファイルに変換する、ただしこのやり方でないと、一部の G...
TACソフトウェアを使ってCELファイルを処理し、そこからエクスポートしたSignal値と遺伝子アノテーションを、Subio Platformにインポートする。 Download Subio Platformは、GeneChipのCELファイルを直接扱うことができません。そこで、Thermo Fisher Scientificのウェブサイトから無料で入手できるTranscriptome A...