caffe本身是没有数据集的,但在data目录下有获取数据的一些脚本。MNIST,一个经典的手写数字库,包含60000个训练样本和10000个测试样本,每个样本为28*28大小的黑白图片,手写数字为0-9,因此分为10类。
1.获取数据
sudo sh ./data/mnist/get_mnist.sh
这个是在caffe的目录下执行的。运行成功后,在caffe/data/mnist/目录下有四个文件:
train-images-idx3-ubyte:训练集样本 (9912422 bytes)
train-labels-idx1-ubyte: 训练集对应标注 (28881 bytes)
t10k-images-idx3-ubyte: 测试集图片 (1648877 bytes)
t10k-labels-idx1-ubyte: 测试集对应标注 (4542 bytes)
这些数据不能在caffe中直接使用,需要转换成LMDB数据
2.转换成lmdb数据
sudo sh ./examples/mnist/create_mnist.sh
这个也是在caffe的目录下执行的。但运行过程中出现了以下错误:
这是因为这个脚本本身要调用convert_mnist_data的二进制文件,需要将convert_mnist_data编译。我使用的caffe并没有编译。
caffe编译之后生成build文件夹,convert_mnist_data.bin就在build文件夹里。
使用编译过后的caffe就能正常转换了: