【资讯来源】:我爱计算机视觉公众号——CVPR 2019 | 文本检测算法PSENet解读与开源实现
【论文地址】:https://arxiv.org/pdf/1806.02559.pdf (Shape Robust Text Detection with Progressive Scale Expansion Network)
【代码-原作者】:https://github.com/whai362/PSENet
【代码2-他人复现】:https://github.com/liuheng92/tensorflow_PSENet
文章思想【转】
该方法能有效地区分相邻的文本实例,且对任意形状文字检测都具有鲁棒性。文章认为其提出的方法能避免现有bounding box回归的方法产生的对弯曲文字的检测不准确的缺点,也能避免现有的通过分割方法产生的对于文字紧靠的情况分割效果不好的缺点。该算法网络框架从FPN中受到启发,采用了U形的网络框架,先将网络提取出的特征进行融合,然后再利用分割的方式将提取出的特征进行像素的分类,最后利用像素的分类结果通过一些后处理得到文本检测结果。
论文中实验结果
运行代码时,未解决的问题
运行代码2时,无法解决以下问题
参考博文