gmt文件定义
gmt格式是多列注释文件,列与列之间都是TAB分割。
- 第1列: 是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。
- 第2列 :官方提供的格式是URL,可以是任意字符串。
- 第3列-第n列: 后面是基因集内基因的名字,有几个写几列。
library(clusterProfiler)
data(gcSample) #加载gcSample数据集
#第一列用X1-X8,第二列无内容用‘NA’代替,第三列-第N列为基因的entrenz id
#文件以制表符分隔开
get_gmt <- function(gcSample,filename){
output <- file(filename, open="wt")
for (name in names(gcSample)) {
outlines = paste0(c(name, "NA", gcSample[[name]]),collapse='\t')
writeLines(outlines, con=output)
}
close(output)
}
#第一个参数传入gcSample数据集,第二个参数为输出的文件名
get_gmt(gcSample,"gcSample.gmt")
参考
https://www.dxy.cn/bbs/newweb/pc/post/41921535