在linux系统中安装pygtftk软件

1.下载和安装

网址: https://dputhier.github.io/pygtftk/index.html
## 手动安装
git clone http://git@github.com:dputhier/pygtftk.git pygtftk
cd pygtftk
# Check your Python version (>=3.8,<3.9)
pip install -r requirements.txt
python setup.py install
## conda 安装
conda install pygtftk

官网有详细说明安装方法:

利用conda 进行安装

##创建环境
conda create -n pygtftk python=3.8
#激活环境
source activate pygtftk
## conda 安装
conda install pygtftk

2. pygtftk软件简介

pygtftk(Python GTF toolkit)是一个用于处理GTF(Gene Transfer Format)文件的工具包。以下是关于pygtftk软件的一些介绍:

  1. 功能与目的

    • pygtftk旨在简化GTF/GFF2.0文件的处理,目前不支持GFF3文件格式。
    • 它提供了一组UNIX命令,可以通过gtftk程序访问,用于过滤、转换或从GTF文件中提取数据。
    • pygtftk包含一个名为OLOGRAM(OverLap Of Genomic Regions Analysis using Monte Carlo)的新命令,用于计算用户提供的区域(BED格式)与GTF注释派生的区域之间的重叠统计信息。
  2. 兼容性与依赖

    • pygtftk与Python版本>=3.8,<3.9兼容,并依赖于用C语言编写的libgtftk库。
    • 它还依赖于一些外部工具,如bedtools、graphviz和unzip等。
  3. 安装

    • 推荐通过conda进行安装,因为pygtftk和gtftk命令行工具需要外部依赖。
    • 如果使用pip安装,需要先安装依赖,并使用pip install pygtftk命令

3.gtf文件处理

3.1gffread

gff转换为gtf文件

gffread -T -o file1 file2(原文件) #-o后跟输出文件名,-T表示输出必须为gtf文件

gffread -T  -o  genes.gtf  SWO.v3.0.gene.model.gff3 #-o后跟输出文件名,-T表示输出必须为gtf文件

4.在手动安装时出现以下报错

参考来源:

Welcome to pygtftk documentation page — gtftk 1.6.2 documentation (dputhier.github.io)

GitHub - dputhier/pygtftk: A python package and a set of shell commands to handle GTF files

seqtk、seqkit、gtftk 的使用-****博客

上一篇:MVC 文件夹结构详解


下一篇:python之面向对象总结