读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章

        第一卷 第二章 内容总结

        这一章叫做图像基础。对于图像和NumPy有了解的读者可以直接跳过这一章。

        这一章主要介绍了图像的一些基本知识、基本属性等;如何访问图像,表示图像;讨论图像的纵横比及其在准备用于训练神经网络的图像数据集时的关系。

        简单说一下内容:

        1、图像由像素组成,深度学习关心的图像或者是彩色,或者是灰度图,所以其它色彩空间的图像不讨论。

读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章
该图像宽1000像素,高750像素,总共1000 * 750=750000个像素

         2、图像的通道,在RGB颜色空间中表示图像,其中每个通道都是一个独立的矩阵,组合后形成最终图像。

        3、图像坐标系

读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章
放置在方格纸上的字母“I”。像素通过它们的(x,y)坐标访问,我们向右移动x列,向下移动y行,记住Python是零索引的。

         4、图像转Numpy数组

# 读取并显示一张图片
import cv2
image = cv2.imread("example.png")
print(image.shape)
cv2.imshow("Image", image)
cv2.waitKey(0)

# 读取图片的坐标上的rgb值
(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20
(b, g, r) = image[75, 25] # accesses pixel at x=25, y=75
(b, g, r) = image[90, 85] # accesses pixel at x=85, y=90

         5、BGR和RGB的顺序,OpenCV的库读取图像的顺必须是BGR。

        6、又讲了一下保持纵横比图像的缩放、不保持纵横比的缩放、以及裁剪等。

 

 

上一篇:获取图片exif及GPS信息metadata-extractor-2.3.1.jar


下一篇:IE11,Windows UI IE11,还使用UA!