**
环境:ubuntu18.04+cuda+pycharm+python2.7
**
问题1.使用caffe进行训练时,常出现 Check failed: error == cudaSuccess (2 vs. 0) out of memory
解决方法:batch_size太大,一次性读入的图片太多了,所以就超出了显存。因此需要将train.prototxt中的文件train和test的batch_size调小一点
问题2:生成均值文件时提示错误: Check failed: mdb_status == 0 (2 vs. 0) No such file or directory
解决方法:由于生成均值的文件中变量没有赋值正确,所以如果出现这个问题,先确定你的生成均值文件中的变量值都是正确的。
问题3.can’t find -lopencv_imgcodecs
解决方法:在Makefile 下:
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial opencv_core opencv_highgui opencv_imgproc opencv_imgcodecs
将 opencv_imgcodecs 删掉
修改,最后,重新 编译make clean;make all -j8
问题4.This file was generated by an older version of protoc
解决方法:protoc 版本冲突问题,可能在conda环境下安装过,系统下也有一个。
查看protoc
$ which protoc
如果conda下有protoc,删掉它
conda uninstall protobuf
问题5.ImportError: cannot import name _remove_dead_weakref
解决方法:conda update python
问题6.ImportError: No module named numpy
解决方法: conda install numpy
问题7.ImportError: No module named skimage.io
解决方法:安装 skimage就行,如果已经安装过了,却还报这个错误。
可以在pycharm 的环境中增加packages,点击安装即可解决
问题8.Unknown database backend
解决方法:训练模型生成lmdb时遇到的错误,解决方法:在Makefile.config里:
重新编译caffe
参考:https://blog.csdn.net/chenhuan20123/article/details/79630725
问题9.Aborted at 1533882407 (unix time) try “date -d @1533882407” if you are using GNU date
原因:GPU占用产生冲突
解决方法:数据层的数据有问题,重新制作lmdb数据。
问题10.Check failed: datum_channels > 0 (0 vs. 0)
原因:lmdb数据错误
解决方法:
lmdb数据重新生成
问题11.no CUDA-capable device is detected
解决方法:没有匹配的cuda,所以重新安装显卡驱动就解决了
问题12.ImportError: No module named google.protobuf.internal
解决方法:将环境切换到我安装probuf的地方,然后就解决了
如果没有安装:pip install protobuf
深度学习小白,第一篇博文,继续caffe踩坑中,未完待续,持续更新~