task3a_gmt函数

gmt文件定义

gmt格式是多列注释文件,列与列之间都是TAB分割。

  • 第1列: 是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。
  • 第2列 :官方提供的格式是URL,可以是任意字符串。
  • 第3列-第n列: 后面是基因集内基因的名字,有几个写几列。
library(clusterProfiler)
data(gcSample) #加载gcSample数据集

#第一列用X1-X8,第二列无内容用‘NA’代替,第三列-第N列为基因的entrenz id
#文件以制表符分隔开
get_gmt <- function(gcSample,filename){
  output <- file(filename, open="wt")
  for (name in names(gcSample)) {
    outlines = paste0(c(name, "NA", gcSample[[name]]),collapse='\t')
    writeLines(outlines, con=output)
  }
  close(output) 
}
#第一个参数传入gcSample数据集,第二个参数为输出的文件名
get_gmt(gcSample,"gcSample.gmt")

task3a_gmt函数

参考

https://www.dxy.cn/bbs/newweb/pc/post/41921535

上一篇:顺序表操作


下一篇:LeetCode-162 寻找峰值