Complex-YOLO: 点云实时目标检测
前言
Complex-YOLO,论文中介绍是一种仅在点云上进行的最先进的实时3D目标检测网络。借鉴了yolo v2的主干网络,扩展了最后的回归策略,提出了Euler-RegionProposal Network (E-RPN)增加了角度的回归,最后通过实验证明了算法的有效。
论文:Complex-YOLO
要点分析
- 把三维点云转换为鸟瞰图的形式作为输入,再应用yolo v2的检测网络。
- 点云编码的方式是将高度、强度、密度信息转化为RGB-map。
- 在网络输出的位置信息,尺度信息,类别信息后增加了角度信息的输出。
- 采用复角的方式表征朝向角避免了单纯回归一个值所存在的奇异值问题(0°突变360°)。
具体算法分析
具体的算法分析如下:
从图中可以看出,主要分为三个过程:
- 点云转化为鸟瞰图
- 鸟瞰图的特征提取
- B-Box的回归损失
点云转化鸟瞰图
首先由激光扫描仪产生3D点云的POI有效区域设置为正前方80*40。将单帧三维点云转化为鸟瞰RGB-map,这里的RGB图不同于图片的RGB色系,是由点云高度信息、点云强度信息、点云密度信息编码所得,编码方式如下:
z
g
z_{g}
zg表示最大高度,
z
b
z_{b}
zb表示最大强度,
z
r
z_{r}
zr表示网络内归一化的密度。
S
j
S_{j}
Sj表示每个点云映射函数,
P
Ω
i
P_{\Omega_{i} }
PΩi表示ROI范围内的所有点集,N是从
P
Ω
i
P_{\Omega_{i} }
PΩi映射到
S
j
S_{j}
Sj的点数。
提取特征
鸟瞰图作为输入,再使用简化的yolo v2的CNN架构,通过复杂的角度回归和 E-RPN 进行扩展,以检测准确的面向多类的 3D 对象,同时仍然实时运行。
最后的 E-RPN 解析了目标的位置、大小、类别和朝向角,与yolo v2相比增加了角度。
在这种扩展的帮助下,E-RPN基于直接嵌入生成网络中的虚分数和实分数来估计精确的目标方向。
B- Box损失回归
目标的朝向角
ϕ
\phi
ϕ可以通过相应的回归参数
t
I
m
t_{Im}
tIm和
t
R
e
t_{Re}
tRe计算得出,他们对应于复数的相位,角度只需使用
arctan
2
(
t
I
m
,
t
R
e
)
\arctan_{2}(t_{Im},t_{Re})
arctan2(tIm,tRe)即可求出。
采用复数的主要原因是:
- 避免奇异性
- 在一个封闭的数学空间,能对模型的推广产生有利影响
论文上的总损失函数为:
L
=
L
Y
o
l
o
+
L
E
u
l
e
r
L = L _{Yolo} + L _{Euler}
L=LYolo+LEuler.
L
Y
o
l
o
L _{Yolo}
LYolo是位置信息、尺度信息和类别信息的损失平方和,
L
E
u
l
e
r
L _{Euler}
LEuler如图所示,
λ
c
o
o
r
d
λ_{coord}
λcoord是保证早期阶段稳定收敛的尺度因子,
1
i
j
o
b
j
1^{obj}_{ij}
1ijobj表示单元i中的第j个预测框在联合(IoU)上具有最高的交集。
参考:
YOLO系列专题——Complex-YOLO
Complex-YOLO,可实现点云上的实时 3D 目标检测
Complex-YOLO