以下がDockerfileの全体です。もともとdebianベースのため、基本的には FROM をdebianからdorowu-bionicに変えただけです。
rnakato/ubuntu となっていますが、これはdorowu/ubuntu-desktop-lxde-vncにいくつかのパッケージをプリインストールしたもので、基本的に同じと思ってもらって大丈夫です。
FROM rnakato/ubuntu:dorowu-bionic
LABEL maintainer "Ryuichiro Nakato <rnakato@iam.u-tokyo.ac.jp>"
WORKDIR /home
ENV DEBIAN_FRONTEND=noninteractive
RUN apt-get update \
&& apt-get install -y--no-install-recommends\
build-essential \
ca-certificates \
git \
libboost-all-dev \
libgsl-dev \
libgtk2.0-dev \
libgtkmm-3.0-dev \
libz-dev \
r-base \
samtools \
&& apt-get clean \
&& rm-rf /var/lib/apt/lists/*
RUN git clone https://github.com/rnakato/SSP.git \
&& cd SSP \
&& make
RUN git clone https://github.com/rnakato/DROMPA3 \
&& cd DROMPA3 \
&& make
RUN git clone --recursive https://github.com/rnakato/DROMPAplus \
&& cd DROMPAplus \
&& git submodule foreach git pull origin master \
&& make
ADD script script
ENV PATH ${PATH}:/home/SSP/bin:/home/DROMPA3:/home/DROMPAplus/bin:/home/DROMPAplus/submodules/cpdf/Linux-Intel-64bit:/home/DROMPAplus/otherbins:/home/script
CMD ["/bin/bash"]
2020-03-02 00:13:46,603 CRIT Supervisor running as root (no user in config file)
2020-03-02 00:13:46,603 WARN Included extra file "/etc/supervisor/conf.d/supervisord.conf" during parsing
2020-03-02 00:13:46,617 INFO RPC interface 'supervisor' initialized
2020-03-02 00:13:46,617 CRIT Server 'unix_http_server' running without any HTTP authentication checking
2020-03-02 00:13:46,617 INFO supervisord started with pid 11
2020-03-02 00:13:47,619 INFO spawned: 'nginx' with pid 14
2020-03-02 00:13:47,629 INFO spawned: 'web' with pid 15
2020-03-02 00:13:47,630 INFO spawned: 'novnc' with pid 16
2020-03-02 00:13:47,631 INFO spawned: 'wm' with pid 17
2020-03-02 00:13:47,632 INFO spawned: 'pcmanfm' with pid 18
2020-03-02 00:13:47,634 INFO spawned: 'lxpanel' with pid 19
2020-03-02 00:13:47,637 INFO spawned: 'xvfb' with pid 20
2020-03-02 00:13:47,646 INFO spawned: 'x11vnc' with pid 21
2020-03-02 00:13:47,902 INFO Listening on http://localhost:6079 (run.py:87)
2020-03-02 00:13:48,715 INFO success: nginx entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,715 INFO success: web entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,715 INFO success: novnc entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,716 INFO success: wm entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,716 INFO success: pcmanfm entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,716 INFO success: lxpanel entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,717 INFO success: xvfb entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)
2020-03-02 00:13:48,717 INFO success: x11vnc entered RUNNING state, process has stayed up for> than 1 seconds (startsecs)127.0.0.1 - - [2020-03-02 00:14:16]"GET /api/health HTTP/1.1"2001220.162835127.0.0.1 - - [2020-03-02 00:14:46]"GET /api/health HTTP/1.1"2001220.143152
途中に 2020-03-02 00:13:47,902 INFO Listening on http://localhost:6079 (run.py:87) というURLが表示されています。このURL (http://localhost:6079) をブラウザに貼り付けるとGUIが開けます。
(6079というのがポート番号です。この数字が6080だったり、その他の数字になっている場合は、dockerをrunするコマンドの -p 6079:80 のポート番号を同じ数字に変更して再実行してください。)
fastqファイルは 4行で1つのリードを表します。
@ で始まる行がリード名、次の T で始まる行が リード配列、4行目は読まれた各塩基のクオリティ(信頼度)を表します。
(このデータでは、3行目は意味を持ちません。)
リード配列が 0,1,2 の数字で表されていますね。
これが color space データ で、【2つの塩基の組み合わせ】を数字で表現したものです。
SOLiD sequencer で読まれた配列はこのような形式で出力されます。
color space形式のfastqファイルはcsfastq形式と呼ばれます。
$ singularity exec ssp_drompa.img ssp
SSP v1.1.3===============
Usage: ssp [option]-i<inputfile>-o<output>--gt<genome_table>
Use --help option for more information on the other options