(CV学习笔记)看图说话(Image Captioning)-2

实现load_img_as_np_array

def load_img_as_np_array(path, target_size):
    """从给定文件[加载]图像,[缩放]图像大小为给定target_size,返回[Keras支持]的浮点数numpy数组.

    # Arguments
        path: 图像文件路径
        target_size: 元组(图像高度, 图像宽度).

    # Returns
        numpy 数组.
    """
使用PIL库:
from PIL import Image as pil_image
img = pil_image.open(file)
img.resize(targent_size,pil_image.NEAREST)

return np.asarray(img, dtype=keras.floatx())
  • assarray方法输入两个参数,第一个图像对象,第二个是转换的参数类型
上一篇:SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning


下一篇:Video Captioning 综述