bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする

Importing Bigwig

bigWig ファイル(ChIP-Seqのデータ)を Subio Paltform にインポートする Download bigWigファイルはサイズが巨大なことが多く、そのままインポートするとSubio Platformがオーバーフローしてしまいがちです。このムービーでは、ゲノム領域を絞ってデータをインポートすることで、データをうまく圧縮する方法を見つける方法を解説します。こうすることで、...

Aggregate Variant ツールの使い方

Aggregate Variants

変異をケースとコントロールで比較し、フィルタリングする。 Download このツールは、注釈付きのVCFファイルを受け付けます。したがって、まず Annotate VCF ツールを実行してください。 インプットのVCFファイル群は、ケースグループとコントロールグループの2つのグループに分かれているかもしれません。このツールは、突然変異の種類と、コントロールグループとケースグループにおける...

RNA-Seq FASTQファイル処理の実行のしかた ~ Subio Platformへのデータインポート

Fastq Processing

Subio Platform にRNA-SeqのFASTQファイルをインポートするのは、  fastp 、 HISAT2 、 StringTie という3つのツールからなるパイプラインを実行させ、発現量を計算することになります。ただし、ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindowsまたはMacのコンピューターで動かせます。特にWindow...

RNA-Seq FASTQファイル処理パイプラインの設定のやり方(Windows 版)

Prep Win

これはWindows10 ユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしMacをお使いでしたらmacOS版の説明をご覧ください。 Windowsコンピューターで、Linux用のプログラムを実行することになりますので、Windows Subsystem for Linux を有効化することと、Ubuntu...

RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)

Prep Mac

これはMacユーザー向けに、RNA-SeqのFASTQファイルをSubio Platformにインポートするための準備について説明したものです。もしWindowsをお使いでしたらWindows10版の説明をご覧ください。 Subio Platformは、下記のツールを使ってRNA-SeqのFASTQファイルを処理します。 fastp アダプター配列を除き、品質の悪いリードを除去する。 HIS...

Enrichment Analysis Tool の使い方

Enrichment Analysis

遺伝子リストから関連の示唆されるGOやパスウェイを検索する。 Download Enrichment Analysis tool は、抽出した遺伝子リストを生物学的コンテキストで解釈するのによく使われます。Gene Ontology (GO)はもちろんですが、パスウェイやサイトバンド、タンパクドメイン、miRNAのターゲットや転写因子のターゲット検索など、幅広い用途に使える便利なツールです...

TSS Plot

Tss Plot

TSS Plot Download TSS Plot ツールは、何らかの値とTSSからの相対距離の関係を視覚化するものです。 よくあるのは、転写調節因子の結合や、DNAまたはヒストンの就職などのイベントの数をヒストグラムで表した図です。Subio PaltformのTSS Plotでは、さらに、メチル化比率や、メチル化状態の上昇または減退といった変化、遺伝子発現パターンとメチル化状態の変化...

Find Matched Samples ツールの使い方

Find Matched Samples

複数のPlatformを跨るマルチオミクスデータの統合解析の準備をする。 Download このツールは、複数のオミックスデータセットを統合するために、さまざまなプラットフォームで共通のサンプルを見つけて印を付けます。このツールはFind miRNA Targets や Find Correlated Regions を使って解析を行うための準備を簡単に行えるようにするユーティリティです。...

一つ、あるいは複数の遺伝子リストをインポートする

Import a or multiple gene lists

Importing a gene list, or a set of lists. Download テキストファイルから、一つまたは複数の遺伝子リストをSubio Platformにインポートして、これらの遺伝子群の発現パターンを概観することができます。また、遺伝子リストをインポートすると、これらをエンリッチメント解析に利用できるようになります。 遺伝子のIDは、Platformに登録さ...

RNA-Seq データ解析のための、正規化のプリセット・シナリオの解説

An RNA-Seq data analysis procedure, slightly different from microarrays'.

これは Subio Platform でRNA-Seqデータの正規化・前処理を行う手順の解説です。R/Bioconductorなどを使われている方にとっても、下記のコンセプトを理解することは有益です。 正規化と前処理の適切なやり方を見つける。 Download Subio Platformでは、下記のプリセットのシナリオを用意しています。データに合わせて選択し、それをベースにデータの特徴に合...

Seriesをコピーする。Seriesに含まれるSampleを追加/削除する

Copying and modifying series

Seriesをコピーしたり、変更したりする Download 大量のSampleやSeriesがある場合に、これらのユーティリティツールは非常に便利です。 Make A Copy of This Series は単純なツールです。しかし、Serieに変更を加える前にコピーしておくのは、安全に作業を進めるために必要です。 Add/Remove Samples は、Seriesから質の悪いSa...

選択した遺伝子の発現パターンを、Seriesを跨いで俯瞰する。

Scan genes over series

選択した遺伝子の発現パターンを、Seriesを跨いで俯瞰する。 Download 大量のSeriesが、複数のPlatformやOrganismにまたがって存在する場合、一つ一つのSeriesを開いて見ていくのは非常に困難になります。 Scan genes over series ツールは、そのような時に鳥観図のような視座を提供してくれます。一つまたは二つの遺伝子名を入力するだけで、その遺...

カプランマイヤー生存曲線ツール

Kaplan-Meier Survival Curve Tool

カプランマイヤー生存曲線を描画する。 Download Kaplan-Meier Survival Curve Tool を使って、カプランマイヤー生存曲線を描画するための準備について解説します。 ある治療を実施したグループとそうでないグループに分けて生存率を比較するなどはこれまで沢山の報告があります。Subio Platformに蓄積されたオミクスデータを使えば、たとえば、特定の遺伝子が...

TCGAのDNAメチル化データをインポートして解析する。

TCGA のメチル化データをインポートする。 Download Subio Platform v1.20.5031 では、GDC (TCGAプロジェクトデータの提供サイト) から、さまざまながんにおけるDNAメチル化データを自動的にダウンロードする機能を搭載しました。どなたでも簡単にこれらのデータ解析を始めらることができます。 データインポートから解析まで一通り学びたい方は、オンライントレ...

TCGAのRNA-Seqデータをインポートする

Importing RNA-Seq data of TCGA

TCGAのRNA-Seqデータをインポートする Download Subio Platform v1.20.5009 では、TCGAまたはTARGETプロジェクトの、さまざまな癌の遺伝子発現データをGDCサイトから直接ダウンロードしてインポートすることができるようになりました。発現量データだけでなく、サンプル情報も合わせて取得されるので、データ解析や探索を簡単に始めることができます。 デー...

発現差のある遺伝子を一括して抽出する

Extracting Differentially Expressing Genes (DEGs) in Bulk

2群間での発現差解析を、まとめて実行する。 Download 発現差のある遺伝子を、1対Nまたは総当たりの組み合わせでまとめて抽出することができます。大量の組み合わせがあるときにとても便利なツールです このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。 関連トピック T検定により発現差のある遺伝子を抽出する

マイクロアレイのフラグ値と、その使い方。

Filtering on Agilent Flag Values

フラグとは、マイクロアレイの測定システムが、測定値とあわせて出力するもので、その測定値の信頼性に関する指標となります。ただ、それぞれの測定システムや、フラグの種類によって意味や特徴がまったく異なりますので、その特徴を理解してフィルターを使うととても強力な解析ツールになります。 Affymetrix GeneChip: Affymetrix GeneChip で、MAS5で解析されたデータの場...

Subio Platformを更新する

Thumbnail Update Your Subio Platform

Subio Platformの最新版へのアップグレードは、いつでも無料で行えます。最新版の有無をチェックして、更新する操作をご覧ください。 このような半自動化プロセスはv 1.19以降でご利用いただけます。v 1.18またはそれ以前のバージョンをお使いの場合は、下記リンクよりアップデータを取得して、実行してください。 Download Updater Subio Platformをバージョン...

Viewやタブの表示・非表示を切り替える

Thumbnail Turn Views And Tabs On Off

メモリーがひっ迫しているときは、Viewerやタブを切ることでしのげることがあります。これは、非常に大きなSeriesを解析しているときにも有効です。 Turning Views and Tabs On/Off Download 100万プローブとか、数千サンプルとかあるような巨大なデータセットを扱うと、Subio Platformは非常に遅くなります。 このようなとき、Viewやタブの表示...

フィルターの使い方

Filtering

フィルターで、測定値の信頼できない遺伝子を除く。 Download 統計解析をする前に、解析にとってノイズとなる遺伝子を Filter ツールを使って除きましょう。具体的には、すべてのサンプルにおいてシグナルがノイズ領域から出ない遺伝子や、発現変動しない遺伝子を除きます。 このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。 0:10 ここで例として使うデ...

階層型クラスタリング

Tree Clustering

ツリークラスタリング:パターンの似た遺伝子グループを概観する。 Download 階層型クラスタリングは発現パターンの似ている遺伝子郡をグループにまとめたり、発現プロファイルの似ているサンプル群をグループにまとめたりして、全体像を大まかに把握するのに便利です。 00:00 Tree Clustering を実行する前に、下記のようなノイズとなる遺伝子群を除去する 値が低すぎて、測定値が信用...

Series と DataSet のセットアップ

Thumbnail Setup Series And Data Sets

Setting Up Series And DataSets Download 実験データをインポートしてSeriesを作成したら、次に行うのが Series と DataSet を適切に設定して解析の準備をすることです。このムービーで、DataSetを適切に設定することで、生物学的にわかりやすくなることを学んでください。ポイントとなるのは、サンプルに実験パラメーター(因子)を適切に割り当...

次世代シーケンサーのデータを Subio Platform で解析できますか?

FAQ

Subio Platform はRNA-Seqのデータは、FASTQファイルからサポートしています。詳しくはRNA-Seqデータ解析チュートリアル をご覧ください。または、Count/FPKM/TPMなどのテキストファイルから解析することも可能です。 ChIP-SeqやMethyl-Seqなどは、生データの解析には対応しておりませんが、一次解析の結果であるBEDファイル等をインポートして解析...

Gene Expression Ombinus (GEO) から取得したマイクロアレイデータをSubio Platformで再解析する

Thumbnail Visualysing And Analysing Geo Data With Subio Platform

はい、GEO の Series レコードから、 SOFT format family ファイルをダウンロードして、Subio Platformにインポートしてください。同じGSEのSOFTファイルから、Platformの作成も、実験データのインポートもできます。 ただし、次世代シーケンサーのデータはSOFTファイルの中に入っていません。このようなGSEを再解析したい場合は、もしSupplem...

Paired T-test で解析するにはどうすればいいですか?

Paired T-test

患者さんのデータを解析するとき、個体差が大きくて知りたい要因の効果を検出することが難しいことがよくあります。もし、同じ患者さんから比較可能な2種類のサンプルを取れるなら、そうすることで検出力が大きく向上させられる可能性があります。というのは、それぞれの患者さんにおけるコントロールと比較対象の差を取り出すことができますので、その差の平均値と分散を解析することで、個体差に惑わされることなく調べた...

Genome View の使い方

Genome View

Genome View の使い方 Download Genome View は、ChIP-SeqやMethyl-Seq、タイリングアレイ、CGH アレイなどのゲノムの位置と深くかかわるデータの解析に必須のゲノムブラウザーです。遺伝子発現データを見ているときも、この視覚化ツールを使って発現が上昇あるいは減少している遺伝子群が、染色体の特定の領域に固まって存在しているかどうかを確認することで、...

Tree View の使い方

Tree View

Tree View の使い方 Download Tree View は、階層型クラスタリングの結果を、ヒートマップとツリー構造で表示するものです。PDF などの画像となっているヒートマップは動きませんが、このツリーでは興味のある発現パターンの遺伝子群を取り出したり、発現プロファイルの似ているサンプル群にマークを付けるなど、インタラクティブに動きます。 操作がよくわからないときは、無料オンラ...

Find Regions from Seq の使い方

Find Regions from Seq

ゲノム上で、指定した塩基配列の個所を検索する。 Download Find Regions from Seq ツールは、特定の塩基配列を検索して、その位置を Region List として保存するものです。このムービーでは、FOXO1の制御配列を遺伝子の上流域に対して検索し、FOXO1によって制御されている可能性のある遺伝子を抽出します。 このツールの使い方がよくわからないときは、無料オン...

ノーマライズを編集する

Editing Normalization

多くの人が気づいていないようなのですが、正規化と前処理はデータ解析において最も重要な部分です。複雑なデータに隠れた知識を読み出せるようにするステップだからです。 次の項目はデータの特徴に大きな影響を与えます。 測定装置・試薬キット・研究所・実験日  RNA-Seqの場合、総リード数・RNAのインプット量・品質 細胞や組織の種類・細胞の選別の有無 生検か保存試料か培養細胞か 成育条件・感染やコ...

主成分分析(PCA)

PCA

主成分分析(PCA):発現プロファイルの違いを概観する。 Download 主成分分析(PCA)は発現プロファイルによるサンプル間の近似度を視覚化します。近くにあるサンプル同士は発現プロファイルが似ています。また、0を境にスコアが正の方向と負の方向に分かれている場合は、逆向きに動いていることを表しています。 このツールの使い方がよくわからないときは、無料オンラインサポートをお申し込みください。

Scatter Plot of Regions の使い方

Scatter Plot of Regions

異なる種類のオミクスデータを統合して、散布図を描く。 Download 異なるタイプのオミクスデータでも Region List に変換しておけば、Scatter Plot of Regions ツールを使って直接比較することができます。 たとえば、遺伝子発現パターンと、その上流域のメチル化サイトのパターンや、染色体のコピー数とその領域にある遺伝子の発現パターンの関係を全体的に把握すること...

Summarize および Create Intervals の使い方

Summarize & Create Intervals

染色体に沿って、値が高い・低い領域を視覚化する。 Download Summarize ツールを使うと、近接するタグやプローブをまとめて平均値などにして、全体的なトレンドを視覚化できます。たとえば、遺伝子発現やDNAメチル化の度合いが高く(または低く)なっている染色体領域を把握するのにとても便利です。 まとめる単位は、遺伝子の転写領域や、コーディング領域、上流域、下流域、あるいは決まったサ...