博客主要结构
1. 如何在ubuntu18.04上安装yolo
2 .如何配置yolov3
3 .如何制作自己的训练集测试集
4 .如何在自己的数据集上运行yolov3
1. 在ubuntu18.04下安装yolov3
安装darknet
按ctrl+atl+t 打开终端, 并在终端下依次输入以下命令
git clone https://github.com/pjreddie/darknet.git cd darknet make
如果成功的话你会看到以下信息
mkdir -p obj gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast.... gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast.... gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast.... ..... gcc -I/usr/local/cuda/include/ -Wall -Wfatal-errors -Ofast -lm....
编译完成后键入以下命令运行darknet
./darknet
你将会看到以下输出结果
usage: ./darknet <function>
使用GPU编译(可选)
如果想让yolo运行的更快的话, 可以使用GPU 加速。你的电脑中应该有Nvidia GPU 并安装cuda。 在安装完cuda后,在本目录下修改 Makefile第一行
GPU=1
然后在终端键入
make
这样就可以使用cuda啦, darknet在默认情况下会使用你系统里第零个块显卡 (如果你成功安装了cuda, 在终端输入nvidia-smi可以看到自己的显卡情况)。 如果你想修改darknet可以使用的显卡,你可以给他一个可选的命令 -i <index>, 例如
./darknet -i 1 imagenet test cfg/alexnet.cfg alexnet.weights
这样darknet就会使用你的第一块显卡。
下载pre-trained model
可以在这里下载预训练模型, 或者在终端输入以下命令
wget https://pjreddie.com/media/files/yolov3.weights
然后训练你的detector
./darknet detect cfg/yolov3.cfg yolov3.weights data/eagle.jpg
正常情况下你会看到如下输出
darknet会把他的检测的结果, 以及confidence输出出来,因为我没有在darknet下编译opencv所以检测结果不会直接显示出来, 他会把这个结果保存在你的darknet目录下。
2 .配置yolov3
在darknet目录下创建一个dataset子目录, 并在dataset中创建yolo-tiny-obj.cfg 文件, 文件内容与yolov3_tiny.cfg(在darknet/cfg文件夹下)相同(可以直接把yolov3_tiny.cfg的文件内容复制过去), 然后
- 把batch所在行修改为batch=64
- 把subdivision设置为8
- 在每个[yolo]-层, 把classes=80修改成你要检测的类的数量
https://github.com/pjreddie/darknet/blob/master/cfg/yolov3-tiny.cfg#L135
https://github.com/pjreddie/darknet/blob/master/cfg/yolov3-tiny.cfg#L176
- 在每个[yolo]-层前的[convolution]-层中,修改filters=255, 改成filters=(classes+5)*3(只适用于yolov3, 对于yolov2如何计算filters,google/百度一下)
https://github.com/pjreddie/darknet/blob/master/cfg/yolov3-tiny.cfg#L127
https://github.com/pjreddie/darknet/blob/master/cfg/yolov3-tiny.cfg#L171
因此如果classes=1, 那么filters=18, 如果classes=2, 那么filters=21
(不要在cfg文件里这样写:filters=(classes+5)*3)
(一般情况下, filters取决于classes, coords, 以及mask的数量, 例如filters = (classes+coords+1)*<numbers of mask>, 这里的mask就是anchors的索引, 如果没有mask, 那么filters=(classes+coords+1)*num)
比如, 只有两个类, 那么你的yolo-tiny-obj.cfg 在每个yolo层中应该是如下设置
[convolutional] filters=21 [region] classes=2
在/darknet/dataset创建obj.names文件, 每行是你的类的名字, 如果你要检测的是猫和狗, 那么你的obj.names文件内容如下
cat dog
在/darknet/dataset创建obj.data文件, 包含如下内容, (classes=你要检测的类的数量)
classes= 2 train = dataset/train.txt valid = dataset/test.txt names = dataset/obj.names backup = backup/
3. 制作自己的训练集测试集
首先把你的训练集(测试集)图片放到/darknet/dataset/Train (/darknet/dataset/Test ) , 图片扩展名为.jpg
然后对你数据集图片上的每个物体作标记,你可以用这个工具在图片上画边框, 并生成标记文件。他会在同一个目录下,给每个.jpg文件生成一个名字相同的.txt文件,文件里应该包含物体的类的编号, 以及物体在图片中的坐标,每一行都表示一个物体 <物体类的编号><x_center> <y_center> <width> <height>
- <类的编号> :是正整数, 从0-<类的数目-1>
-
<x_center> <y_center> <width> <height>
:都是浮点数范围从0到1,通过图片的长宽计算得出,例如<y_center>=<边框中心的纵坐标>/图片的高,<height> = <边框的高>/图片的高 - 注意<x_center> <y_center>:是你画得边框的中心
比如对于img1.jpg你会创建一个img1.txt文件,包含以下内容
1 0.716797 0.395833 0.216406 0.147222 0 0.687109 0.379167 0.255469 0.158333 1 0.420312 0.395833 0.140625 0.166667
在/darknet/dataset目录下创建train.txt文件,文件中每一行都是到你训练集的地址, 可以使绝对路径, 也可以是相对路径, (相对darknet这个文件夹的路径), 例如文件内容如下
dataset/Train/img1.jpg dataset/Train/img2.jpg dataset/Train/img3.jpg
这里你需要重新根据你自己的数据集计算anchors值, 可以参开这个python script 来计算, 然后把yolo-tiny-obj.cfg文件中的anchors值替换成你计算的结果
4 .在自己的数据集上运行yolov3
下载yolov3-tiny的权重文件:https://pjreddie.com/media/files/yolov3-tiny.weights 到darknet目录下
在终端输入以下命令得到预训练模型yolov3-tiny.conv.15
./darknet partial dataset/yolo-tiny-obj.cfg yolov3-tiny.weights yolov3-tiny.conv.15 15
输入以下命令开始训练
./darknet detector train dataset/obj.data dataset/yolo-tiny-obj.cfg yolov3-tiny.conv.15
如果一切正常应该是这样的结果
如果你运行中出现了nan, 这是正常现象,但如果全部都是nan的话,这就是训练过程出了问题,请仔细检查每一步是否按照操作进行