项目场景:
在使用tensortflow运行Python项目时,项目代码正常是要运行到五万集,但是每次运行到两三万集合的时候就会被中断退出。
问题描述:
在使用tensortflow运行Python项目时,项目代码正常是要运行到五万集,但是每次运行到两三万集合的时候就会被中断退出。
2021-11-10 22:29:33.555843: W tensorflow/core/framework/op_kernel.cc:1401] OP_REQUIRES failed at concat_op.cc:153 : Resource exhausted: OOM when allocating tensor with shape[1000,512] and type float on /
job:localhost/replica:0/task:0/device:CPU:0 by a
Process finished with exit code -1073740791 (0xC0000409)
原因分析:
查找了很久原因,大部分博主说的都是内存不足的问题,也尝试了网上的各种方法:例如:
将内存从750m改为2048m,依然出现此问题,未解决我的问题,其他的小伙伴若出现这个问题可以尝试一下。
又尝试将batch_ size从256改为128,依然报错。
解决方案:
将batch_size继续缩小,继续尝试