推荐一些用CRF做图像语义分割的资源

原文地址:http://blog.sina.com.cn/s/blog_5309cefc01014nri.html

首先是code,以前找了很多,但发现比较好用的有:

1. Matlab版的UGM:http://www.di.ens.fr/~mschmidt/Software/UGM.html,可实现crf的inference和learning,作者Mark Schmidt,写了很多实用的工具箱。

2. C++版的gco-v3.0:http://vision.csd.uwo.ca/code/,用于求解crf(即inference),作者Olga Veksler,专门研究Graph cut算法。

3. Oxford *es的ALE: http://cms.*es.ac.uk/staff/PhilipTorr/ale.htm,作者Lubor Ladicky,花了5年时间完成这套代码,他在博士期间的所有工作几乎都在其中,c++代码写得很规范,能学到不少东西,依赖库只有DevIL(以前叫openil,没用opencv),需要耐心仔细地结合论文看才能看懂。

4. ANU的Stephen Gould开发的c++库Darwin:http://drwn.anu.edu.au/,能在windows下用,但更适合linux,工具箱里的一些应用也包括了他博士时做的工作,仔细研究这个库可以学到不少先进的东西。

5. OpenGM2:http://hci.iwr.uni-heidelberg.de/opengm2/,专门用于图模型离散优化的c++库,其中包含了多种算法,详见2013年的一篇CVPR:A Comparative Study of Modern Inference Techniques for Discrete Energy Minimization Problems (http://ipa.iwr.uni-heidelberg.de/ipabib/Papers/Kappes-etal-cvpr-2013-benchmark.pdf)

另外,如果要研究高阶的CRF,可以参见这几个人的主页:

1. Pushmeet Kohli,这是个专家级的,2007年Oxford *es的Phd毕业,其间就研究这个,现在在MSRC:

http://research.microsoft.com/en-us/um/people/pkohli/

2. Lubor Ladicky,继续了Kohli的工作,2011年Oxford *es的Phd毕业,现在ETH,主要用CRF做场景理解和姿态估计等:

http://www.robots.ox.ac.uk/~lubor/

3. Chris Russell,毕业于Oxford *es,现在QMUL,研究方向和Lubor Ladicky差不多(导师都是Philip Torr),但更偏重高阶CRF:

http://www.eecs.qmul.ac.uk/~chrisr/

4. Stephen Gould,2010年Stanford的Phd毕业,现在ANU,也用高阶CRF做场景理解,还开发了一套工具箱(Darwin),比较适合在Linux下用。

http://users.cecs.anu.edu.au/~sgould/index.html

如果看了这几个人的Phd Thesis,基本上就对Higher Order CRF有比较清晰的认识了。

要是谁有兴趣研究该方向,可以多多交流~ ~

上一篇:Javascript - ExtJs - 整合百度文章编辑器


下一篇:委托、Action泛型委托、Func泛型委托、Predicate泛型委托的用法