【UCSC Genome Browser 大乱炖】Genes and Gene Predictions - GENCODE
GENCODE 是Sanger研究院维护的基因组功能注释数据库(https://www.gencodegenes.org),UCSC浏览器整合了这一数据库,方便研究人员对基因信息进行研究。
GENECODE 配置信息
点击GENCODE v32可以对显示参数进行设置。
-
display mode
信息的展示由多到少,full(全部显示)>pack>squish>dense>hide(隐藏) -
Label
可以根据自己的需要显示gene symbol, GENCODE Transcript ID, UCSC Known Gene ID, UniProt Display ID, OMIM ID; -
Show
UCSC默认只显示基础数据集(Basic gene set),如果需要更全面的数据集( Comprehensive gene set)也是可以自己选择的
大部分基因有多个转录本,USCS浏览器都会进行展示,如果只想显示一条,可以去除勾选 splice variants, 会显示最长转录本(最长转录本简单粗暴,后续我们会更新其他选择主要转录本的方法)。
-
Show codon numbering
对密码子进行设置,是否显示密码子编号; -
Color track by codons
可以按照下面的格式对密码子进行颜色标记:
-
根据基因水平线的粗细来区分CDS、UTR以及Intron区域(粗框表示CDS,细框表示UTR,线表示intron,)连接线上的箭头指示转录方向。
-
根据颜色对基因进行分类(个人认为这个标记并不准确,供参考)
-
Display data as a density graph
可以显示指定区域的基因密度图(参考:http://genome-asia.ucsc.edu/goldenPath/help/hgWiggleTrackHelp.html)
-
Data access
提供获取数据的方式
GENECODE 基因信息
上图是GENECODE track 显示的基因信息(以DMD基因为例),如果我们想了解更多基因信息可以点击左侧的基因名称(建议用鼠标中键,在新标签中打开,否则在当前页打开),这里我们选择蓝色背景的转录本ENST00000357033.8(这是DMD基因的常用转录本,后续会讲如何选择常用转录本)。
打开之后会发现,这个页面详细介绍了DMD基因的情况,大家可以根据自己的需要进行查看。
- Sequence and Links to Tools and Databases(与其他数据库的关联)
- MalaCards Disease Associations(基因与疾病的联系)
- Comparative Toxicogenomics Database (基因与药物/化合物的联系)
- RNA-Seq Expression Data from GTEx (RNA-Seq中基因的在53个组织中表达情况)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NZ5RePWR-1633434706806)(https://cdn.jsdelivr.net/gh/filess/img7@main/2020/12/01/1606819517233-e44e6191-152c-410b-b269-b70139c98999.png)]
- Microarray Expression Data(基因芯片数据中基因的表达情况)
- mRNA Secondary Structure of 3’ and 5’ UTRs(基因UTR区域的二级结构)
- Orthologous Genes in Other Species(其他物种的同源基因)
- Descriptions from all associated GenBank mRNAs(GenBank中的其他转录本)
- Biochemical and Signaling Pathways(基因相关的信号通路)
- Other Names for This Gene(基因的其他名字)
- GeneReviews for This Gene(NCBI GeneReviews数据库对基因的介绍)
基本上,你想要的基因信息都给你了