Palmsonntagmorgen

NGSデータを使った解析と、その周辺。

ChIP-seq

chromapを試す(その1)

chromapは高速・高精度にリードをゲノムにマップするツールです*1。 既存ツールのbwaやbowtie2よりも遥かに高速だとのことなので、ここではChIP-seqデータを用いて使用法及び速度・精度面を確かめてみたいと思います。 chromapについて chromap は minimap2*…

【DROMPAplus】Dockerを使ったparse2wig+

そういえばDROMPAplusの紹介記事を全然書いていないことに気づきました。 最近はDockerイメージからのDROMPAplusの使い方をたびたび質問いただくので、今日はDockerを使ったDROMPAplusの使い方を紹介します。 なお、旧バージョンのDROMPA3とDROMPAplusの違い…

sortコマンドの使い方(ファイルのソート)

以下の記事の中で、sortコマンドについて触れていました。 rnakato.hatenablog.jp 多くのコマンドはsorted BEDを要求しますので、事前に以下のコマンドで全てのBEDをソートしておくとストレスがないかと思います。 $ sort -k1,1 -k2,2n in.bed > in.sorted.b…

DROMPAplusを公開しました

少し前になりますが、DROMPA3のアップデートであるDROMPAplusを正式にリリースしました。 DROMPAplus: a pipeline tool for ChIP-seq analysis — DROMPAplus 1.4.0 documentation 今回はその記事です。 Reference 4月に以下の論文を公開しました。ChIP-seq解…

2サンプル間ピーク比較

2つのサンプルから得られたピークセットがどのくらい重なるのか調べたい!という時の方法です。 今回はBEDtoolsを使うやり方と、拙作のcompare_bsを使うやり方を紹介します。 ピークデータのダウンロード ピークはBED形式であれば何でもよいのですが、ここ…

LiftOver: BEDファイルを異なるbuildへ変換

公開されているゲノム配列は現在も更新中であるため、いくつかのバージョン (build) があります。 humanだとhg18, hg19, hg38などがあり、hg38が現時点で最新です。 NGS解析をするうえでは全ての解析データのbuildを統一する必要がありますが、「既存論文の…

DROMPA3: その10 ヒートマップ

今回はDROMPAを用いたヒートマップの描画について説明します。 HEATMAPコマンド(TSS周辺) 前回の記事では、DROMPAを用いたリードプロファイルの描画について解説しました。 rnakato.hatenablog.jp 使ったコマンドは以下のようなものです。(詳しくは前回の記…

DROMPA3: その9 リードプロファイル

DROMPA3を用いたリードプロファイルの描画です。 ここでプロファイルと呼んでいるものは、遺伝子回り、あるいはピーク回りにおけるマップリードの平均分布のことで、aggregation plotと呼ばれることもあります。 全遺伝子や全ピークの平均値として見ることに…

S/N比の評価手法 その4 SSP

時間がかかってしまいましたが、やっとSSPの登場です。 この記事は以下の記事の続きです。 S/N比の評価手法 その1 - Palmsonntagmorgen S/N比の評価手法 その2 Cross-correlation profile - Palmsonntagmorgen S/N比の評価手法 その3 deepTools - Palmsonnt…

S/N比の評価手法 その3 deepTools

今回はIHEC projectの公式品質評価ツールに採用されているdeepToolsについて解説します。 deepToolsとは deepToolsはChIP-seq, RNA-seq, MNase-seqなどの品質評価及び種々の可視化をするために作られたソフトウェアで、samtoolsやbamtoolsでは手の届かないよ…

S/N比の評価手法 その2 Cross-correlation profile

これは前回の記事の続きですので、未読の方はそちらから読んでください。 Cross-correlation profile Cross-correlation profile (以下CCP)はENCODEのグループによって提案されたS/N比計測手法です*1。 CCPは、順鎖ー逆鎖間のマップリード分布の「ずれ」を利…

S/N比の評価手法 その1

私が開発したChIP-seqの品質評価ツール"SSP"の論文がBioinformatics誌にアクセプトされました。 Sensitive and robust assessment of ChIP-seq read distribution using a strand-shift profile | Bioinformatics | Oxford Academic 本論文はbioRxivでも無料…

DROMPA3: その8 GVコマンドでのマクロな可視化

今回は、全染色体を1行でマクロに可視化するGVコマンドを使います。なおGVはGlobal viewの略です。 parse2wig 今回はROADMAP web portalからダウンロードしたK562細胞のヒストン修飾データ一式を使います。 以下のコマンドでtagAlignファイルをダウンロード…

BEDtoolsワンライナー覚書

BEDtoolsの作者は開発熱心なので、できることがどんどん増えているような気がします。 手元のバージョンはv2.27.1です。 前準備 多くのコマンドはsorted BEDを要求しますので、事前に以下のコマンドで全てのBEDをソートしておくとストレスがないかと思います…

DROMPA3: その6 ChIP/Input ratio 及び p値の可視化

リード分布の可視化の続きです。 このエントリは↓の記事の続きになりますので、まだ読んでいない方は先にこちらを参照してください。 DROMPA3: その4 マップリード分布の可視化その1 - Palmsonntagmorgen Input readの可視化 前回はChIPサンプルのみを可視化…

DROMPA3: その5 シェル変数を使う

今日はシェル変数について。 前回の記事の「複数サンプルの可視化」の項で、以下のコマンドを実行しました。 $ drompa_draw PC_SHARP \ $ -i parse2wigdir/H3K4me3,parse2wigdir/Input,H3K4me3 \ $ -i parse2wigdir/H3K27me3,parse2wigdir/Input,H3K27me3 \ …

DROMPA3: その4 マップリード分布の可視化その1

今回はDROMPA3のメイン機能であるマップリード分布の可視化を紹介します。 インストール DROMPA3のインストール方法についてはこの記事を参照してください。 Genome table作成 DROMPA3の実行にはGenome tableファイルが必要になります。 Genome tableの作成…

DROMPA3: その3 ピーク抽出(peak calling)

DROMPA3解説その3はピーク抽出(peak calling)です。ピーク抽出とは、ゲノムからreadが有意に濃縮している箇所を網羅的に同定する作業です。 インストール DROMPA3でのピーク抽出は、drompa_peakcall を使います。 DROMPA3のインストール方法についてはこの…

Library complexity (PCR bias)とは何か

前回の DROMPA3: その2 parse2wig - Palmsonntagmorgen で登場した評価指標である Library complexity (PCR bias) の解説です。 PCR biasとは クロマチン免疫沈降法(ChIP)で得られたリードをゲノムにマップすると、以下のようなマップリード分布が得られる…

DROMPA3: その2 parse2wig

parse2wigはマッピングファイルを入力とし、Wig形式に変換してくれるツールです。 内部でPCR biasのフィルタ、Total readによる正規化、種々の品質評価も行います。 インストール DROMPA3のインストール方法についてはこの記事を参照してください。 単にpars…

DROMPA3: その1 インストール

今回からは私が開発したDROMPA3の利用法について解説します。 DROMPAとは ChIP-seq解析のためのパイプラインツールです。ピーク抽出の他、品質評価、可視化、複数サンプルの比較解析などができます。 複数のサンプルを同時に解析できること、pdf形式でデータ…

SAMtoolsとリダイレクト

SAMtools 先日紹介したリードのマッピングの記事では、出力をSAM形式に指定していました。 rnakato.hatenablog.jp SAM形式はファイルサイズが非常に大きく読み込みにも時間がかかるので、バイナリ形式のSAMであるBAM形式が下流解析でよく利用されています。 …

Readをゲノムにマッピング (その3) 圧縮ファイルを入力にする方法

マッピングの記事その3。 Readをゲノムにマッピング (その1) - Palmsonntagmorgen Readをゲノムにマッピング (その2) - Palmsonntagmorgen 圧縮ファイル(fastq.gz)を直接マッピングの入力にする方法です。 圧縮ファイルのままマッピングしたい fastqファ…

Readをゲノムにマッピング (その2)

前回の続きです。 Readをゲノムにマッピング (その1) (2017/12/19, 2018/11/19 追記あり) - Palmsonntagmorgen 今回ではbowtie, bowtie2, bwaのマッピングコマンドを説明します。 どのマッピングツールも、ゲノム配列をindex配列にまず変換し、そのindexに…

Readをゲノムにマッピング (その1) (2017/12/19, 2018/11/19 追記あり)

NGS解析の最初のステップは、シーケンサから出力されたfastq形式のリード配列をゲノム配列にマップするマッピングです。 これにより、ゲノム上のどの領域から得られたリードなのかを知ることができます。 マッピングツール ChIP-seq解析で主に用いられるマッ…