《You Only Look Once: Unified, Real-Time Object Detection》翻译



                                Y                         o                         u                                                                            O                         n                         l                         y                                                                            L                         o                         o                         k                                                                            O                         n                         c                         e                         :                         U                         n                         i                         f                         i                         e                         d                         ,                         R                         e                         a                         l                         −                         T                         i                         m                         e                                                                            O                         b                         j                         e                         c                         t                                                                            D                         e                         t                         e                         c                         t                         i                         o                         n                            You\ _{}Only\ _{}Look\ _{}Once: Unified, Real-Time\ _{}Object\ _{}Detection                 You Only Look Once:Unified,Real−Time Object Detection

                                J                         o                         s                         e                         p                         h                                                                            R                         e                         d                         m                         o                         n                         ,                         S                         a                         n                         t                         o                         s                         h                                                                            D                         i                         v                         v                         a                         l                         a                         ,                         R                         o                         s                         s                                                                            G                         i                         r                         s                         h                         i                         c                         k                         ,                         A                         l                         i                         F                         a                         r                         h                         a                         d                         i                             Joseph\ _{}Redmon,Santosh\ _{}Divvala,Ross\ _{}Girshick,Ali Farhadi                 Joseph Redmon,Santosh Divvala,Ross Girshick,AliFarhadi

                                你                         只                         需                         要                         看                         一                         次                         :                         统                         一                         的                         实                         时                         目                         标                         检                         测                             你只需要看一次:统一的实时目标检测                 你只需要看一次:统一的实时目标检测

  摘要:我们介绍YOLO,这是一种新的目标检测方法。之前的目标检测工作是通过重新使用分类器来进行检测。取而代之,我们将目标检测设计为空间分隔的边界框和相关类别概率的回归问题。单个神经网络可以在一次评估中直接从完整图像中预测边界框和类别概率。由于整个检测通道是单个网络,因此可以直接在检测性能上进行端到端优化。
  我们的统一架构非常快,基础YOLO模型以每秒45帧的速度实时处理图像。较小的网络Fast YOLO惊人的每秒处理155帧,而且实现了其他实时检测器两倍的mAP。与最先进的检测系统相比,YOLO会产生更多的定位错误,但在背景上预测假阳性的可能性较小。最后,YOLO学习了非常普通的目标表示形式。从自然图像推广到艺术品等其他领域时,它的性能优于其他检测方法,包括DPM和R-CNN。

《You Only Look Once: Unified, Real-Time Object Detection》翻译

图1 YOLO检测系统。使用YOLO处理图像非常简单明了。我们的系统(1)将输入图像的大小调整为448×448,(2)在图像上运行单个卷积网络,并且(3)通过模型的置信度对检测结果进行阈值化。


《You Only Look Once: Unified, Real-Time Object Detection》翻译

图2 模型。我们的系统模型检测作为一个回归问题。它将图像划分为S×S网格,并为每个网格单元预测B边界框,这些框的置信度和C类别概率。这些预测被编码为S×S×(B∗5+C)张量。

《You Only Look Once: Unified, Real-Time Object Detection》翻译

图3 架构。我们的检测网络有24个卷积层,然后是2个全连接层。交替的1×1卷积层减少了前面层的特征空间。我们以一半的分辨率(224×224输入图像)对ImageNet分类任务上的卷积层进行预训练,然后将分辨率提高一倍以进行检测。

《You Only Look Once: Unified, Real-Time Object Detection》翻译

图6 定性结果。 YOLO运行来自网络上的艺术品和自然图像。尽管它确实认为一个人是一架飞机,但大多数情况下都是准确的。
上一篇:OO第二单元反思与总结


下一篇:Ubuntu20.04美化过程