1.下载和安装
网址:
https://dputhier.github.io/pygtftk/index.html
## 手动安装
git clone http://git@github.com:dputhier/pygtftk.git pygtftk
cd pygtftk
# Check your Python version (>=3.8,<3.9)
pip install -r requirements.txt
python setup.py install
## conda 安装
conda install pygtftk
官网有详细说明安装方法:
利用conda 进行安装
##创建环境
conda create -n pygtftk python=3.8
#激活环境
source activate pygtftk
## conda 安装
conda install pygtftk
2. pygtftk软件简介
pygtftk(Python GTF toolkit)是一个用于处理GTF(Gene Transfer Format)文件的工具包。以下是关于pygtftk软件的一些介绍:
-
功能与目的:
- pygtftk旨在简化GTF/GFF2.0文件的处理,目前不支持GFF3文件格式。
- 它提供了一组UNIX命令,可以通过
gtftk
程序访问,用于过滤、转换或从GTF文件中提取数据。 - pygtftk包含一个名为OLOGRAM(OverLap Of Genomic Regions Analysis using Monte Carlo)的新命令,用于计算用户提供的区域(BED格式)与GTF注释派生的区域之间的重叠统计信息。
-
兼容性与依赖:
- pygtftk与Python版本>=3.8,<3.9兼容,并依赖于用C语言编写的libgtftk库。
- 它还依赖于一些外部工具,如bedtools、graphviz和unzip等。
-
安装:
- 推荐通过conda进行安装,因为pygtftk和gtftk命令行工具需要外部依赖。
- 如果使用pip安装,需要先安装依赖,并使用
pip install pygtftk
命令
3.gtf文件处理
3.1gffread
gff转换为gtf文件
gffread -T -o file1 file2(原文件) #-o后跟输出文件名,-T表示输出必须为gtf文件
gffread -T -o genes.gtf SWO.v3.0.gene.model.gff3 #-o后跟输出文件名,-T表示输出必须为gtf文件
4.在手动安装时出现以下报错
参考来源:
Welcome to pygtftk documentation page — gtftk 1.6.2 documentation (dputhier.github.io)
GitHub - dputhier/pygtftk: A python package and a set of shell commands to handle GTF files
seqtk、seqkit、gtftk 的使用-****博客