Palmsonntagmorgen

NGSデータを使った解析と、その周辺。

RNA-seq

gtfファイルからrefFlat形式への変換

みなさんgtfファイルからrefFlatに変換する時ってどうされてるんですかね?Rを使っている? 自分は自作のツール "gtf2refFlat" を使っているので、ここではそれを紹介します。 gtf形式については↓をご覧ください。 https://bi.biopapyrus.jp/rnaseq/mapping/…

STAR-RSEMによる発現量推定 その3

前回の記事↓の続きです。 STAR-RSEMによる発現量推定 その1 - Palmsonntagmorgen STAR-RSEMによる発現量推定 その2 - Palmsonntagmorgen 前回のコマンドを最後まで完了すると、starディレクトリの中にstar/Myers_HUVEC_cell_2x75_200_1.<genes|isoforms>.results のようなフ</genes|isoforms>…

STAR-RSEMによる発現量推定 その2 (2020/08/20 追記)

前回の記事↓の続きです。 STAR-RSEMによる発現量推定 その1 - Palmsonntagmorgen Stranded/Unstranded RNA-seq RNA-seqにはunstrandedとstranded の二種類があります。unstrandedの場合はmRNAに対して半々の確率で順鎖と逆鎖が読まれ、stranded の場合は逆…

STAR-RSEMによる発現量推定 その1

私が普段使っているSTAR, RSEMを使った発現量推定法を紹介します。 あまり最新のアップデート情報などをフォローできていないので、もっと良いやり方をご存知の方はご教示ください。 ここでは例題として、ヒトES細胞とHUVEC細胞をペアエンドで読んだサンプル…

Gene annotation データを用意する(gtf形式)

RNA-seq解析の記事を書こうとしたらgtfファイルの部分が長くなり過ぎたので単独記事にしました。 Gene annotation 既知遺伝子の情報を記載するファイルにはいくつかの形式があり、gtf形式はそのひとつです。 よく似たgff形式というものもありますが、微妙に…

HISAT-StringTie-Ballgown を試してみよう その2

前回の記事の続きです。 HISAT-StringTie-Ballgown を試してみよう - Palmsonntagmorgen 発現量データ生成 前回の記事で発現量データを生成するのを忘れていたので、ここで生成します。stringtieを使います。 for prefix in ERR188044 ERR188104 ERR188234 E…

HISAT-StringTie-Ballgown を試してみよう

せっかくNature Protocolの論文があるので試してみよう企画。 Nature Protocolはスクリプトがそのまま載っているので、追試に最適です。 一方、古いライブラリが指定されていると手元の環境で動かなかったり、著者のレベルによってへんてこなスクリプトにな…

RNA-seqによる発現量解析

本業の方で色々忙しくなっておりまして、更新の間が開いてしまいました。 今回はRNA-seqについて語りたいと思います。 RNA-seqはChIP-seqよりもメジャーなので、日本語での解説ブログも充実していますが、情報が古いものだと今だにtophat-cufflinksを使って…