写在前面的话:
疫情的影响,一直没有开学,一家人老实在家待着,除了看看孩子之外就是学习一下新的东西了。
再啰嗦一下:
之前分析Rna-seq的流程忘得差不多了,近期感觉记笔记是个好习惯,于是开始记笔记。现学现卖,作为现学现卖的第一篇,今天就讲讲conda吧。
为什么用conda呢?
是因为,之前接触conda简单就是为了安装软件用,别人怎么用我就怎么搞。我想了想,不能这么干,一直想学习一下。
为什么是今天说conda呢?
是因为最近按了一款软件,hisat2,学习过生信的人都知道hisat2,这是一款比对软件,跟bwa不同这款软件是用来讲rna比对到基因组的软件。最近在网上报了一个学习班,转录组分析班,在这里就不说是哪个学习班了,免得说是打广告。培训班有培训班的好处,也有不好的地方,抽空写一篇杂文再叨叨一下。
我用的conda是4.8.2版本的,conda 安装hisat2的时候很顺利,但是在用软件的时候产生了一个错误,
Traceback (most recent call last): File "/home/xpy/miniconda3/envs/genek/bin/hisat2_read_statistics.py", line 210, in <module> reads_stat(args.read_file, args.read_count) File "/home/xpy/miniconda3/envs/genek/bin/hisat2_read_statistics.py", line 168, in reads_stat for id, seq in fstream: File "/home/xpy/miniconda3/envs/genek/bin/hisat2_read_statistics.py", line 44, in parser_FQ if line[0] == '@': IndexError: index out of range HISAT2 summary stats: Total reads: 500000 Aligned 0 time: 76217 (15.24%) Aligned 1 time: 398465 (79.69%) Aligned >1 times: 25318 (5.06%) Overall alignment rate: 84.76%
这个错误并没有影响我的数据分析,但是我看着不爽,于是bing,bing搜索的结果是biostar上的,也没啥好意见。于是google,google的结果挺好(哈哈),
是生信技能树的老大写的(https://wemp.app/posts/d2ceaf19-f6a4-47bd-b558-0500efd5ce72),说是可能是因为gcc的版本不同导致的,但是不影响分析。看来这种情况正常。我的conda中 gcc版本是7.3.0 。
/home/xpy/miniconda3/envs/genek/bin/hisat2-align-s version 2.2.0 64-bit Built on default-56ff2f81-e3ff-4461-b225-c02e23186a2f Wed Mar 11 23:09:57 UTC 2020 Compiler: gcc version 7.3.0 (crosstool-NG 1.23.0.450-d54ae) Options: -O3 -m64 -msse2 -funroll-loops -g3 -DPOPCNT_CAPABILITY -std=c++11 Sizeof {int, long, long long, void*, size_t, off_t}: {4, 8, 8, 8, 8, 8}
啰嗦了这么多,还是说一下怎么安装conda吧:
上网找到了清华的镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/
下载最新的miniconda,(为什么成了miniconda,自己百度一下conda和miniconda吧)
wget -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py38_4.8.2-Linux-x86_64.sh
sh Miniconda3-py38_4.8.2-Linux-x86_64.sh
其他默认就行,如果你想安装到别的地方,也可以。安装的时候,conda 会把自己放到环境变量中,一定要看仔细。
进入conda需要以下方式:
source ~/miniconda/bin/activate . ~/miniconda/bin/activate
今天就写到这里吧。下一次记录一下,常用的conda命令。
我引用的资料:
https://www.jianshu.com/p/2c0dde188065
生信菜鸟团微信公众号:可重复的生信分析系列二:Conda的介绍