首先,我们知道要是图片的大小为80*60,生成的数据就会有80*60个,这样要是图片多的话,csv得到数据就是很多,我们可以考虑把图片缩小
我的图片都是放在目录E:\machineStudy\ta-lib\picture下
我们将灰度图片转为csv,一般都是用来做神经网络学习,一般我们都是给不同的情况贴上标签,我这里就是将10中不同的情况贴上0-9的标签,0-9目录下存在不同情况的图片,我们要做的就是将每个目录下的灰度图都转为csv格式数据,一个图片对应一行数据,并且在csv文件中的第一位存放着我们的标签,也就是0-9的数字。这里要注意,我一开始就说了,我们灰度图的图片可能会很大,我的就是80*60,csv得到的数据会很多,打开文件都得花很长时间,所以我们就可以考虑将我们的图片放小。
程序代码:
# -*- coding:utf-8 -*-
import csv
import os
import cv2
#图片所在的目录
IMG_DIR = r"E:\machineStudy\ta-lib\picture"
def convert_img_to_csv(img_dir):
#这个是输出文件的位置,自己定义
with open(r'E:\machineStudy\ta-lib\picture\train_data.csv', 'w',
newline='') as f:
column_name = ['label']
#这里图片的大小为80*60,生成的数据就会有80*60个,csv文件一行是放不下的,所以我们要把图片放小
column_name.extend('pixel%d' % i for i in range(80 * 60))
writer = csv.writer(f)
writer.writerow(column_name)
for i in range(10):
img_file_path = os.path.join(img_dir, str(i))
img_list = os.listdir(img_file_path)
print(img_file_path)
for img_name in img_list:
img_path = os.path.join(img_file_path, img_name)
img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
#下面两行是将图片放小为原来的1/8,
x, y = img.shape[0:2]
img_test1 = cv2.resize(img, (int(y / 8), int(x / 8)))
image_data = [i]
image_data.extend(img_test1.flatten())
# print(image_data)
writer.writerow(image_data)
if __name__ == "__main__":
convert_img_to_csv(IMG_DIR)
控制台输出遍历完的文件目录名
查看生成的train_data.csv文件
第一列就是我们不同的标签,其他列就是我们图片的像素,一行就是一个图片的数据