导论-视觉生产
定义和分类
定义
通过一个/一系列视觉过程,产出新的视觉表达
- 产出:人或机器能够感知的图像视频,而不是标签或特征;
- 要求:新的,和输入不一样的
视觉生产过程输入参数/素材产出素材/成品
分类
- 生成:从0到1
- 拓展:从1到N
- 摘要:从N到1
- 升维:从An到An+1
- 增强/变换:从A到B
- 插入/合成:A+B=C
- 擦除:A-B=c
通用基础框架
五个关键维度
2精细理解——寻微入里
分割抠图
唯能理解,方能生成
难点
解题思路
思路:
- 复杂问题拆解:粗mask估计+精准matting
- 丰富数据样本:设计图像mask统一模型
模型框架
效果展示
人像抠图拓展(动态视频抠图)
物体抠图拓展(车辆分割要考虑玻璃中小草的倒影)
场景抠图拓展
视觉生成
鹿班
框架流程
鹿班电商设计
鹿班场景智能美工
鹿班行业设计
视频生成——AlibabaWood
官网:http://alibabawood.aliyun.com
框架流程
视频摘要
视频封面
视觉编辑——移花接木
视频植入
植入位检测与定位
动态检测分割
视频内容擦除
文字擦除
Logo擦除
画幅变化
图像尺寸变化
视觉增强——修旧如新
人脸修复增强
渲染图超分
视频超分
HDR色彩扩展
风格迁移
颜色拓展
视觉制造——由虚入实
实体设计制造的缺点
核心逻辑
包装几何生成
服装几何生成
视觉迁移及融合
多样性拓展
2D 3D融合
视觉开放平台——万剑归宗
定位
官网:http://vision.aliyun.com
能力分布
特点
一站式能力选择
省心省力的普惠服务
解决方案:公共场所口罩佩戴监测系统–神荼
解决方案:视频自动广告植入系统
解决方案:服饰趋势分析与辅助设计
阿里云高校计划二维码