2 车型识别的探索和实践

2.1 研究意义
(1)解决视频资源无法产生价值、浪费存储资源的问题
在园区安防、仓储监管、智慧交通领域,有大量的摄像头对某一场景进行监控,并将获得的视频存储到本地服务器,占用大量的存储资源,存储一定周期后便进行删除。所获得视频资源除了备份之外,并未发挥更多的价值。而通过视频结构化分析,一方面可以通过提取关键帧、关键元素来减少视频存储的资源消耗,另一方面,便于检索,在需要时可以更快速地找到目标。
(2)解决无法融入大数据体系的问题
监控录像作为非结构化数据,它不能直接被计算机读取和识别,因此一直无法较好地与大数据体系进行兼容,无法利用计算机来进行视频数据的分析和挖掘。而视频图像能否通过智能分析技术经济而又高效地进行结构化处理,是视频大数据在智慧城市、数字社区领域落地的关键。
(3)沉淀产品 —— 视频结构化分析
视频结构化不仅仅可以服务于雷数大数据平台,也可以作为单独的产品提供给客户,结合人体行为识别,可以针对用户的某一特定场景产生价值,如工人进入工地是否带安全帽、作业行为是否符合规范等。
(4)技术积累 —— 计算机视觉
当前人工智能在工业场景的应用中,计算机视觉技术的需求场景占据较多比例,同时在工业、物流业、智慧城市行业的项目中有多种应用,但公司目前在该领域的技术积累仍然较少,因此实践和积累相关的计算机视觉技术经验对于公司未来发展具有重要意义。
2.2 公开数据集
MIO-TCD数据集是由在一天中的不同时间和一年中不同时段获得的137,743个图像组成,这些图像来自在加拿大和美国各地部署的数千个交通摄像机。选择这些图像是为了应对广泛的目标识别挑战,并且代表了当今城市交通情景中捕获的典型视觉数据。每个移动物体已被近200人仔细识别,以便于实现各种算法的定量比较和排序。该数据集旨在提供严格的基准测试,用于训练和测试现有的或新的算法,对交通场景中移动车辆进行分类和定位。
包含的数据标签有11类:
o Articulated truck(铰链式挂车)
o Bicycle(自行车)
o Bus(公交车)
o Car(轿车)
o Motorcycle(摩托车)
o Motorized vehicle (i.e. Vehicles that are too small to be labeled into a specific category)(因目标对象在图像中太小而无法标定为特定类别的车辆)
o Non-motorized vehicle(非机动车)
o Pedestrian(行人)
o Pickup truck(皮卡车)
o Single unit truck(单箱载重汽车)
o Work van(7座的商务车或面包车)
类别样例如下:

Articulated truck Bicycle Bus Car

Motorcycle Non-motorized vehicle Pedestrian Pickup truck

Single unit truck Work van
然后我们开始对车型图片进行标注,标注的软件我们使用的是开源的LabelImg,下载地址:https://github.com/tzutalin/labelImg。点击“Open Dir”、“Change Save Dir”选择刚刚建立的images以及labels文件夹,接下来就可以使用按钮选择需要label的图片,点击“Create RectBox”激活窗口绘图工具,开始标注,如图5.2所示。

模型训练完成,如图所示,能识别出car、work_van、single_unit_truck、pedestrian这些细分特征。mAP=0.70.

2.3 结果评价
YoloV3在其官网的介绍中写道,其在COCO数据集中能达到60.6%的map,而本文使用的MIO-TCD数据集在2017年的CVPR MIO-TCD挑战赛的结果中,最高达到了77%的平均精度,因此,本文测试的YoloV3模型的mAP为70%属于正常范围。YoloV3在55个epoch的训练后期有点过拟合了,所以,模型继续训练的意义不大,只能更改YoloV3模型,提高其性能。
YOLOv3参数表如表5.2所示,方便以后再遇到类似目标检测任务时速查。
表5.2 YOLOv3训练参数
参数类型 参数值
batch_size 8
image_size 416
cfg.filters num(yolo层个数)*(classes+5)
epoch 52
mAP 0.7
2 车型识别的探索和实践

上一篇:6 开源人体动作识别OpenPose的安装与测试


下一篇:Ubuntu18.04LTS下cuda10.0+cudnn7.5+TensorFlow1.13环境搭建