Palmsonntagmorgen

NGSデータを使った解析と、その周辺。

Linux

Readをゲノムにマッピング (その2)

前回の続きです。 Readをゲノムにマッピング (その1) - Palmsonntagmorgen 今回ではbowtie, bowtie2, bwaのマッピングコマンドを説明します。 どのマッピングツールも、ゲノム配列をindex配列にまず変換し、そのindexに対してマッピングするという手順を踏…

Readをゲノムにマッピング (その1)

NGS解析の最初のステップは、シーケンサから出力されたfastq形式のリード配列をゲノム配列にマップするマッピングです。 これにより、ゲノム上のどの領域から得られたリードなのかを知ることができます。 マッピングツール ChIP-seq解析で用いられるマッピン…

pyenvでPython環境を構築する

ざっくりですが。 Pythonツールのインストール 最近はPythonで書かれたツール類が増えてきています。 pip や conda でツールをインストールできるのはエラーも少なく、大変便利ですね。 ただ、pythonは2系と3系があり、python2.xでしか動かないツール、pytho…

ENA,DDBJからfastqを取得する

前回のエントリでは、SRAからfastqを取得する方法を紹介しました。 SRAからfastqを取得する - Palmsonntagmorgen 一方、ENA (European Nucleotide Archive) やDDBJから直接fastqファイルをダウンロードすることも可能です。 European Nucleotide Archive < E…

2bit genome を作成する

2bit genome はゲノム配列ファイルを2bit 形式で格納したものです。 2bit 形式はテキストエディタで開くことはできませんが、multifasta 形式よりも非常に高速にプログラムに読みこむことができるため、 ゲノム解析ツールを使う際にまれに 2bit genomeを要求…

常染色体と性染色体のみのゲノム配列ファイル genome.fa を作成する

UCSC genome browserからダウンロードした ゲノム配列データにはコンティグ配列なども含まれていますが、これらは通常ゲノムの解析には用いません。 そこでこれらを除去し、常染色体と性染色体のみのゲノム配列ファイル genome.fa を作成します。 ここではhg…