11. mRNA seq

事前に目を通しておくべき書籍や web サイト
遺伝子発現解析(マイクロアレイ解析, RNA-seq):株式会社セルイノベーター
 - 上流解析(PPI, TF enrichment, 共発現)


大阪大学の mRNA seq に関して
・データファイルが送られてくる(?形式)
・マッピングに使用してるソフト: 
・FPRKは

生物技研の有料解析について
・2020年の3月頃に、丸山君の mRNA seq データを生物技研に送り、有料で解析をしてもらった
・ヒートマップ作成で15万くらい
・データは大阪大学の XXX で取得してもらったもの
・大阪大への依頼はこちらから web サイト

飛田→半田
featureCountsを用いたRPKM正規化についての手順について(生物技研の手法)Count作業を行わずに、Excelに記載されていたRPKMの値をそのまま用いた場合、RPKMの値が正規化されていない(それぞれのサンプルでの0合わせができていない)という理解で間違いないでしょうか

半田→飛田
featureCountsは、参照配列上にマップされたリードを遺伝子の位置情報に従い、カウントするソフトウェアです。納品データのRaw_count (featureCounts出力のまま)は正規化されていませんが、RPKM_normalizationの値であれば、遺伝子長と総リード数で正規化されています。ただ、RPKMは必要最低限の正規化法です。 詳細は、以下の門田さんのスライドをご参照下さい。

飛田→半田
これまで、解析において Bowtie and tophatでマッピング後、パラメーター類はデフォルトでCufflinksにて定量化されたFPKM値をそのまま使っておりました。 その場合、featureCountsを用いたRPKM_normalizationの値との違いはありますでしょうか。

半田→飛田
Cufflinksとの違いはあります。 以前、私も気になって検証したことがあります。Cuffdiffの正規化はかなりあまくて発現変動遺伝子が 出やすい傾向にありました。 また、cufflinks pipelineやtophatはもう更新されておらず、 かなり古いソフトウェアになっています。弊社では、マッピングソフトウェアや正規化法についても最新の手法を用いているので、そのような差が生じている
のかと思います。

20200525阪大に解析条件を依頼。今週中に生物技研に転写因子濃縮分析について問い合わせ。