tensorflow中图像增强的方法详解

tf.keras.preprocessing.image.ImageDataGenerator()官方文档如下:

 1 tf.keras.preprocessing.image.ImageDataGenerator(
 2     featurewise_center=False, 
 3     samplewise_center=False,
 4     featurewise_std_normalization=False,             
 5     samplewise_std_normalization=False,
 6     zca_whitening=False, 
 7     zca_epsilon=1e-06, 
 8     rotation_range=0, 
 9     width_shift_range=0.0,
10     height_shift_range=0.0, 
11     brightness_range=None, 
12     shear_range=0.0, 
13     zoom_range=0.0,
14     channel_shift_range=0.0, 
15     fill_mode=nearest, cval=0.0,
16     horizontal_flip=False, 
17     vertical_flip=False, 
18     rescale=None,
19     preprocessing_function=None, 
20     data_format=None, 
21     validation_split=0.0, 
22     dtype=None
23 )    

1. featurewise_center

布尔类型,大意是数据集去中心化,每个输入样本除以整个数据集的标准差

2. samplewise_center  

布尔类型,大意是样本去中心化,每个输入样本除以自身的标准差

3. featurewise_std_normalization

布尔类型,输入样本除以数据集的标准差以完成标准化, 按feature执行

4. samplewise_std_normalization

布尔类型,输入样本除以自身的标准差以完成标准化

5. zca_whitening

布尔类型,对输入数据施加ZCA白化,即对图像进行PCA降维操作,减少图片的冗余信息,保留最重要的特征,细节可参看:Whitening transformation--*(https://en.wikipedia.org/wiki/Whitening_transformation),Whitening--斯坦福(http://ufldl.stanford.edu/wiki/index.php/Whitening)

6. rotation_range

整数(取值为0-180的整数),数据提升时图片随机转动的角度, 在 [0, 指定角度] 范围内进行随机角度旋转

7. width_shift_range

浮点数(取值为0-1的浮点数,可以大于1,但最好不要大于1),水平方向平移的幅度(平移距离 / 图像宽度)

8. height_shift_range

浮点数(取值为0-1的浮点数,可以大于1,但最好不要大于1),垂直方向平移的幅度(平移距离 / 图像高度)

9. shear_range

浮点数,剪切强度(逆时针方向的剪切变换角度),效果就是让所有点的x坐标(或者y坐标)保持不变,而对应的y坐标(或者x坐标)则按比例发生平移,且平移的大小和该点到x轴(或y轴)的垂直距离成正比。

tensorflow中图像增强的方法详解

 

10. zoom_range

浮点数或形如[width_zoom_range, height_zoom_range]的列表。若为浮点数,图片同时在长宽两个方向进行同等程度的放缩操作;若为列表,即分别对长宽进行不同程度的放缩

参数大于0小于1时,执行的是放大操作,当参数大于1时,执行的是缩小操作

11. channel_shift_range

浮点数,颜色通道的数值偏移,改变图片的整体颜色,相当于给整个数据集加了一个“滤镜”

12. fill_mode

‘constant‘,‘nearest‘,‘reflect‘或‘wrap‘之一,当对图片进行平移、放缩、剪切等操作时,图片中会出现一些缺失的地方,那这些缺失的地方该用什么方式补全呢?就由fill_mode中的参数确定

 13. cval

浮点数或整数,当fill_mode=‘’constant‘’时,指定要向超出边界的点填充的值

14. horizontal_flip

布尔值,随机的对图片进行水平翻转,意味着不一定对所有图片都会执行水平翻转,这个参数适用于水平翻转不影响图片语义的时候。

tensorflow中图像增强的方法详解

 

15. vertical_flip

布尔值,随机垂直翻转

16. rescale

浮点数(取值为0-1的浮点数),将在执行其他处理前乘到整个图像上,我们的图像在RGB通道都是0~255的整数,所以该值通常定为 1/255

17. preprocessing_function

将被应用于每个输入的函数。该函数将在任何其他修改之前运行。该函数接受一个参数,为一张图片(秩为3的numpy array),并且输出一个具有相同shape的numpy array

18. data_format

字符串,“channel_first”或“channel_last”之一,代表图像的通道维的位置。该参数是Keras 1.x中的image_dim_ordering,“channel_last”对应原本的“tf”,“channel_first”对应原本的“th”。以128x128的RGB图像为例,“channel_first”应将数据组织为(3,128,128),而“channel_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channel_last”。

tensorflow中图像增强的方法详解

上一篇:青龙面板2.8+ninja京东扫码获取CK搭建


下一篇:数学杂题选做