视觉AI训练营——Day1

什么是视觉生产?

通过一个/一系列视觉过程,产出新的视觉表达。
产出:人或机器能够感知的图像视频,而不是标签或特征;
要求:新的,和输入不一样的!
视觉AI训练营——Day1

视觉生产的分类

  • 生成:从0到1
  • 拓展:从1到N
  • 摘要:从N到1
  • 升维:从An到An+1

视觉生产的通用框架

主要分成4个部分:请求,分发,服务,相应
视觉AI训练营——Day1

视觉生产的五个关键维度

1.满足视觉/美学表现
2.合乎语义/内容逻辑
3.保证结果的丰富性
4.提供用户预期的抓手
5.带来用户/商业价值

进一步理解

1.识别

知道是什么

2.检测

识别+知道在哪儿

3.分割

识别+检测+知道每一个像素是什么
难点:数据严重不足,标注成本高

思路:
1、复杂问题拆解:粗mask估计+精准matting
2、丰富数据样本:设计图像mask统一模型

效果图

视觉AI训练营——Day1

视觉生成——无到有

视觉生成——鹿班

鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的Al设计服务

视觉生成的流程

1.理需求

2.定草图
3.选状态
4.调细节
5.生成图
6.好评坏

视频编辑——移花接木

视频植入

1.挖掘视频,核心价值部分
2.扩大植入,珈盖范围
3.提升植入,效果效率

视频编辑

擦除不要的内容

视觉增强——修旧如新

视频增强

生成对抗技术与图像翻译技术相融合

大规模虚拟数据生成与真实数据交叉训练
隐式光流计算与多帧特征融合提升时域稳定性

效果图

视觉AI训练营——Day1

视觉增强——风格迁徙

经过SOTA显著性检测算法(SalGAN)验证,该算法有效提升了风格迁移的Attention Consistency。

视觉迁徙——颜色扩展

即通过算法改变颜色

视觉制造——由虚入实

实体设计制造现状

·效率低:多次打样,多次沟通(服装设计平均30天)

·定制难:无法实现柔性生产
·协同差:设计、营销、生成脱节、倒置

目前使用后视觉AI后流程

1.输入
2.生成
3.多样
4.生产

总结

随着AI的势头持续高涨,AI在智能视觉系统中的应用呈现出非常光明的未来。在硬件方面,已经出现了专用处理器;在软件方面,有越来越强大的算法,能够识别物体、面部和姿势。从AI的市场应用方面看,首先是智能家居和智能安防市场;第二是用于个人身份认证(解锁、支付)的手机安全系统;最后是生物特征识别及其在智能建筑和智慧城市中的应用。AI领域涌现出了大量的投资、收购和合作关系,而且在未来的几年内市场规模将相当可观,市场和收入都将快速增长。

上一篇:C++ code Summary --- 2015.11.8


下一篇:faster rcnn test demo ---repaired for video input and save the image, label, score et al. into .mat format