发表在Nature Methods上的在线分析工具,是一个怎样的操作?

发表在Nature Methods上的在线分析工具,是一个怎样的操作?

https://cibersort.stanford.edu/


聊一个发表在26分杂志上的在线分析神器,此前白介素同学写过一期关于免疫浸润分析,数据挖掘新高度的推文。 这里是续集,数据挖掘新高度(二)


Step1准备数据


在数据分析之前首先需要准备好自己的数据格式,要求不能有缺失值,txt文档不能有双引号,建议数据不要经过log转换。


mixture文档,实际上就是要自己准备好一个表达矩阵,举个栗子如下:


第一个文件

发表在Nature Methods上的在线分析工具,是一个怎样的操作?

特别注意一点是,数据格式对ID类型不作要求,唯一的要求是必须跟其它提供的文件ID是匹配的,这个还是比较容易做到的嘛。


第二个文件

可以自己输入Signature文件作为参考signature,如果自己准备就准备成下面框框的格式。 也可以选择它本身提供的 LM22 这个signature文件,但要强调的是 LM22仅仅在两个芯片平台上验证过,RNA-seq平台未验证,并且,如果用这个,必须保证你的Mixture文件的ID也用的HUGO。 

 

发表在Nature Methods上的在线分析工具,是一个怎样的操作?

________________________________________


如果行自己上传 gene signature也是可行的,准备好 signature文件即可。 除此以外如果自己没有 gene signature的话,又不用它自带的 gene signature的话,也可以用,这时就要提供下面两个文件,利用这个数据库来产生 gene signature:

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


还需要一个 phenotype的文件,格式如下:

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


Step2-上传文件 and Run


下面我们来上传一个数据分析下试试看,上传一个mixture文件,格式如下:

发表在Nature Methods上的在线分析工具,是一个怎样的操作?

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


需要几分钟的时间处理,然后就可以在结果部分看到,行为sample名,列为免疫浸润分数。

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


还有另外一个图:

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


除此之外呢,提供所有,分析结果的 CSV, pdf等格式的数据下载,这样就方便大家自己去下载,然后按照自己的要求绘制其它图形,得到的重要结果就是免疫浸润分数。

发表在Nature Methods上的在线分析工具,是一个怎样的操作?



聊一聊这个免疫浸润分析工具的来头,该数据库由斯坦福大学医学院的研究团队开发的,相关论文2015年发表在 Nature Methods杂志上,截止目前的引用量为645次。

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


这个工具其实在此前白介素同学撰写的[肿瘤免疫浸润分析工具汇总]一文中有提到过,上次还做了标注。跟此前介绍的 TIMER 数据库(https://cistrome.shinyapps.io/timer/)相比呢,在使用的友好程度上没有那么高,但是引用次数更高。

发表在Nature Methods上的在线分析工具,是一个怎样的操作?


需要注册,比较麻烦。而且教程不够完善,个人认为教程讲的不是很清楚,对新手而言要使用需要一定的学习成本。另外就是可视化程度不够高,而TIMER的美图,确实是超酷啊。不过既然发表的论文在高级的杂志,可能在算法层面有自己的优越性吧,这个就超出白介素同学能力范围了,这里不作评价了。至于究竟使用哪个,还是需要看大家自己的需求哈,反正都是可靠的!


好了,这是白介素同学自己探索这个分析工具的所得基本就是这些啦,探索的过程比较曲折,还是分享给大家。


上一篇:过滤器(filter)


下一篇:vvvvvvue