一天学会Trinity转录组无参组装

软件trinity使用流程

1. 数据下载

从NCBI的SRA下载原始下机数据,选择双端测序的Pair-end,但是一般只有一个文件,需要进行格式转换与解压:
2. 安装软件
本次全部使用conda进行,在conda中安装trinity和其他附带软件:

	conda install -c bioconda blast
	conda install -c bioconda trinity

还需要安装sratoolkit,但是conda中没有找到这个软件,所以直接wget了,如果此链接失效可以寻找其他链接:

wget  https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

可能还需要安装bowtie2,但是conda安装失败,不兼容目前python,建议wget
3. 数据转换/解压
tar -zxvf Trinity-v2.4.0.tar.gz
unzip download.1
fastq-dump -gzip -split-3-A ERR2040864.1
[fastq-dump依赖包sratoolkit;-split-3-A 能够将ERR2040864.1分为3个文件,双端2个,剩下的1个存放不能归于双端的reads]
4. 运行trinity
直接运行以下命令会出错:

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &

原因是trinity不兼容目前的java版本,确切来说是第三步butterfly不兼容,因为这部分程序是用java编写的。
解决办法1:

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --JM 5G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 --no_run_butterfly --no_run_quantifygraph &

添加–no_run_butterfly --no_run_quantifygraph ;可以运行前两步,网上说是分开运行,的确可以成功,但解决不了全部问题。
解决办法2:
修改trinity配置文件,使它能够兼容jdk1.7:
配置文件位置:/home/chenss/anaconda3/envs/transcript/bin/Trinity ;使用vi /java查找并修改成1.7;
再运行

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &
即可。
PS:/home/chenss/anaconda3/envs/transcript/bin/Trinity 是指conda中trinity存放位置。
	修改配置文件之前--JM 5G没报错,修改后报错了,只能删除,又加入--max_memory 1G才能运行成功。

更新于:2020年11月24日09点31分

上一篇:P4782 【模板】2-SAT 问题


下一篇:rMATS输出结果文件只有表头