之前写过Trinity,也是个老牌软件Trinity:转录组从头组装_trinity组装转录组-****博客
今天看文献有人用rnaSPAdes,可能大家比较了解SPAdes,用在宏基因组和单菌组装比较多
之前也写过,在下载metaSPAdes时,其实已经把rnaSPAdes给下载了metaSPAdes,megahit,IDBA-UB:宏基因组装软件安装与使用_metaspades和megahit-****博客
rnaSPAdes使用
转录组组装 - SPAdes Assembly Toolkit
首先,我用的去rRNA软件是SortMeRNA,我的代码输出的是一个的非rRNA序列fastq
查找rRNA:barrnap,宏转录组去除rRNA:SortMeRNA-****博客
为了防止出现错误,我先将这一个fastq分成两个
使用bbtools的reformat.sh
BBtools安装和使用-****博客
#使用bbtools的reformat.sh
~/bbmap/reformat.sh -in=other.fq -out=other_1.fastq -out2=other_2.fastq
#查看分的对不对
head other_1.fastq
head other_2.fastq
#然后批量组装
num=${i%%_sortmerna_1.fastq}
${software_path}/SPAdes/SPAdes-3.15.5/rnaspades.py \
-o ${num}_rnaSPAdes -1 ${num}_sortmerna_1.fastq -2 ${num}_sortmerna_2.fastq \
-t 180 -m 450
结果文件介绍:
"此外,rnaSPAdes 将具有不同过滤水平的转录本输出到 /: - hard_filtered_transcripts.fasta
- 仅包括表达量相当高的长而可靠的转录本。 - soft_filtered_transcripts.fasta
- 包括短和低表达的转录本,可能包含垃圾序列。
我们建议您使用主文件,以防您对项目没有任何特定需求。transcripts.fasta"
transcripts.fasta 用这个就行了