阿里云AI训练营_视觉生产技术

本文探讨了视觉生产、理解、生成、编辑、增强和制造的前沿技术,包括图像视频生成、分割抠图、视觉编辑、视觉增强以及视觉制造的逻辑与方法。重点介绍了鹿班、视频生成与编辑、图像修复、风格迁移等技术,并讨论了视觉智能开放平台的应用。

探索和应用

一、 视觉生产

  1. 定义:通过一个/一系列视觉过程,产出新的视觉表达
    (1) 产出:人或机器能够感知的图像视频,而不是标签或特征;
    (2) 要求:新的,和输入不一样的
  2. 分类
    (1) 生成:从0到1
    (2) 拓展:从1到N
    (3) 摘要:从N到1
    (4) 升维:从An到An+ 1
    (5) 增强/变换:从A到B
    (6) 插入/合成: A+B=C
    (7) 擦除: A-B=C
  3. 通用基础框架
    在这里插入图片描述
  4. 五个关键维度
    (1) 可看
    (2) 合理
    (3) 多样
    (4) 可控
    (5) 可用
    二、 精细理解
  5. 分割抠图
    (1) 识别
    (2) 检测
    (3) 分割
    难点:复杂背景、遮挡、发丝精抠、边缘反色、透明材质、多尺度/目标,数据严重不足,标注成本高
  6. 模型框架
    在这里插入图片描述
    三、 视觉生成
  7. 鹿班
  8. 视频生成
    四、 视觉编辑
  9. 视频植入
    在这里插入图片描述
  10. 植入位检测与定位
    (1) 空白区域自动检测
    (2) 遮挡、移出屏幕等复杂情况跟踪
  11. 视频内容擦除
    在这里插入图片描述
  12. 文字擦除
  13. Logo擦除
  14. 画幅变化
  15. 图像尺寸变化
    五、 视觉增强——修旧如新
  16. 人脸修复增强
  17. 渲染图超分
  18. 视频插帧
  19. 风格迁移
    在这里插入图片描述
  20. 颜色拓展
    六、 视觉制造
  21. 核心逻辑
  22. 包装几何生成
  23. 材质工艺
  24. 视觉迁移及融合
  25. 多样性拓展
  26. 2D3D融合
    七、 视觉智能开放平台
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值