首先为什么我们需要对数据集进行Data Augmentation
- 对于现有的数据集来说,有些时候往往是不够的。举个例子,汽车识别,如果训练集当中只有汽车的正方位的图片,那么如果我们需要识别的图片是汽车的侧方位,这就导致了识别率的不高
- 进行了数据加强,那么就能够让机器有足够的训练集去训练,这样一来就可以显著的提高识别率
本文主要参考的博客
那么数据加强都有哪些功能
-
旋转|反射变换:随机图像一定角度,改变图像内容的朝向
-
翻转变换:沿着水平或垂直方向翻转图像
-
缩放变换:按照一定比例放大或者缩小图像
-
平移变换:在图像平面上对图像以一定的方式进行平移;可以采用随机或人为定义的方式指定平移范围和平移步长, 沿水平或竖直方向进行平移. 改变图像内容的位置;
-
尺度变换:对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;
-
对比度变换:在图像的HSV颜色空间,改变饱和度S和V亮度分量,保持色调H不变. 对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间), 增加光照变化;
-
噪声扰动: 对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;
-
颜色变换:在训练集像素值的RGB颜色空间进行PCA, 得到RGB空间的3个主方向向量,3个特征值, p1, p2, p3, λ1, λ2, λ3. 对每幅图像的每个像素Ixy=[IRxy,IGxy,IBxy]T进行加上如下的变化:
[p1,p2,p3][α1λ1,α2λ2,α3λ3]T其中:αi是满足均值为0,方差为0.1的随机变量.
实现代码:
# -*- coding: utf-8 -*-
__author__ = 'Administrator'
import numpy as np
import tensorflow
# import packages
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img
datagen = ImageDataGenerator(
rotation_range=0.2,
width_shift_range=0.2,
height_shift_range=0.2,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True,
fill_mode='nearest')
# img = load_img('C:\Users\Administrator\Desktop\dataA\lena.jpg') # this is a PIL image, please replace to your own file path
img = load_img(
'D:/picture1/xz.jpg') # this is a PIL image, please replace to your own file path
x = img_to_array(img) # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape) # this is a Numpy array with shape (1, 3, 150, 150)
# the .flow() command below generates batches of randomly transformed images
# and saves the results to the `preview/` directory
i = 0
for batch in datagen.flow(x,
batch_size=1,
save_to_dir='D:/picture', # 生成后的图像保存路径
save_prefix='lena',
save_format='jpg'):
i += 1
if i > 20: # 这个20指出要扩增多少个数据
break # otherwise the generator would loop indefinitely
实现效果如下:
1.首先我们需要自己去找到一张需要加强数据集的图片
2.然后就是数据加强之后的图片
3.虽然结果出来了,但是还是有点问题,虽然说数据加强代码实现了旋转,平移,放大缩小,填充像素,但是还是有一些不足的地方
比如下图,图片的周围都是不清晰的像马赛克一样的东西
每一岁的成长,都仍要奔走在自己的热爱里 |
---|