推荐一些用CRF做图像语义分割的资源

2023-02-14 07:26:35

原文地址：http://blog.sina.com.cn/s/blog_5309cefc01014nri.html

首先是code，以前找了很多，但发现比较好用的有：

1. Matlab版的UGM：http://www.di.ens.fr/~mschmidt/Software/UGM.html，可实现crf的inference和learning，作者Mark Schmidt，写了很多实用的工具箱。

2. C++版的gco-v3.0：http://vision.csd.uwo.ca/code/，用于求解crf（即inference），作者Olga Veksler，专门研究Graph cut算法。

3. Oxford *es的ALE: http://cms.*es.ac.uk/staff/PhilipTorr/ale.htm，作者Lubor Ladicky，花了5年时间完成这套代码，他在博士期间的所有工作几乎都在其中，c++代码写得很规范，能学到不少东西，依赖库只有DevIL（以前叫openil，没用opencv），需要耐心仔细地结合论文看才能看懂。

4. ANU的Stephen Gould开发的c++库Darwin：http://drwn.anu.edu.au/，能在windows下用，但更适合linux，工具箱里的一些应用也包括了他博士时做的工作，仔细研究这个库可以学到不少先进的东西。

5. OpenGM2：http://hci.iwr.uni-heidelberg.de/opengm2/，专门用于图模型离散优化的c++库，其中包含了多种算法，详见2013年的一篇CVPR：A Comparative Study of Modern Inference Techniques for Discrete Energy Minimization Problems (http://ipa.iwr.uni-heidelberg.de/ipabib/Papers/Kappes-etal-cvpr-2013-benchmark.pdf)

另外，如果要研究高阶的CRF，可以参见这几个人的主页：

1. Pushmeet Kohli，这是个专家级的，2007年Oxford *es的Phd毕业，其间就研究这个，现在在MSRC：

http://research.microsoft.com/en-us/um/people/pkohli/

2. Lubor Ladicky，继续了Kohli的工作，2011年Oxford *es的Phd毕业，现在ETH，主要用CRF做场景理解和姿态估计等：

http://www.robots.ox.ac.uk/~lubor/

3. Chris Russell，毕业于Oxford *es，现在QMUL,研究方向和Lubor Ladicky差不多（导师都是Philip Torr），但更偏重高阶CRF：

http://www.eecs.qmul.ac.uk/~chrisr/

4. Stephen Gould，2010年Stanford的Phd毕业，现在ANU，也用高阶CRF做场景理解，还开发了一套工具箱（Darwin），比较适合在Linux下用。

http://users.cecs.anu.edu.au/~sgould/index.html

如果看了这几个人的Phd Thesis，基本上就对Higher Order CRF有比较清晰的认识了。

要是谁有兴趣研究该方向，可以多多交流~ ~

码农公寓

相关文章