【深度学习】基于Keras的Data Augmentation方法

首先为什么我们需要对数据集进行Data Augmentation

  • 对于现有的数据集来说,有些时候往往是不够的。举个例子,汽车识别,如果训练集当中只有汽车的正方位的图片,那么如果我们需要识别的图片是汽车的侧方位,这就导致了识别率的不高
  • 进行了数据加强,那么就能够让机器有足够的训练集去训练,这样一来就可以显著的提高识别率

本文主要参考的博客

那么数据加强都有哪些功能

  • 旋转|反射变换:随机图像一定角度,改变图像内容的朝向

  • 翻转变换:沿着水平或垂直方向翻转图像

  • 缩放变换:按照一定比例放大或者缩小图像

  • 平移变换:在图像平面上对图像以一定的方式进行平移;可以采用随机或人为定义的方式指定平移范围和平移步长, 沿水平或竖直方向进行平移. 改变图像内容的位置;

  • 尺度变换:对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;

  • 对比度变换:在图像的HSV颜色空间,改变饱和度S和V亮度分量,保持色调H不变. 对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间), 增加光照变化;

  • 噪声扰动: 对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;

  • 颜色变换:在训练集像素值的RGB颜色空间进行PCA, 得到RGB空间的3个主方向向量,3个特征值, p1, p2, p3, λ1, λ2, λ3. 对每幅图像的每个像素Ixy=[IRxy,IGxy,IBxy]T进行加上如下的变化:
    [p1,p2,p3][α1λ1,α2λ2,α3λ3]T

    其中:αi是满足均值为0,方差为0.1的随机变量.

实现代码:

# -*- coding: utf-8 -*-
__author__ = 'Administrator'

import numpy as np
import tensorflow

# import packages
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

datagen = ImageDataGenerator(
    rotation_range=0.2,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

# img = load_img('C:\Users\Administrator\Desktop\dataA\lena.jpg')  # this is a PIL image, please replace to your own file path
img = load_img(
    'D:/picture1/xz.jpg')  # this is a PIL image, please replace to your own file path

x = img_to_array(img)  # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape)  # this is a Numpy array with shape (1, 3, 150, 150)

# the .flow() command below generates batches of randomly transformed images
# and saves the results to the `preview/` directory

i = 0
for batch in datagen.flow(x,
                          batch_size=1,
                          save_to_dir='D:/picture',  # 生成后的图像保存路径
                          save_prefix='lena',
                          save_format='jpg'):
    i += 1
    if i > 20:  # 这个20指出要扩增多少个数据
        break  # otherwise the generator would loop indefinitely

实现效果如下:

1.首先我们需要自己去找到一张需要加强数据集的图片
【深度学习】基于Keras的Data Augmentation方法
2.然后就是数据加强之后的图片
【深度学习】基于Keras的Data Augmentation方法
3.虽然结果出来了,但是还是有点问题,虽然说数据加强代码实现了旋转,平移,放大缩小,填充像素,但是还是有一些不足的地方
比如下图,图片的周围都是不清晰的像马赛克一样的东西
【深度学习】基于Keras的Data Augmentation方法

每一岁的成长,都仍要奔走在自己的热爱里
上一篇:PAT A 1057 Stack (30分)


下一篇:逆向软件工程