达摩院视觉ai图像识别项目

本文详细介绍了视觉生产技术,涵盖定义、分类、关键维度和具体应用,如图像分割、视频生成、视觉增强等。通过实例解析,阐述了AI在图像领域的应用,包括实例分割、图像生成、视频内容擦除等技术,展示了AI如何提升视觉内容的质量和多样性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

视觉生产技术

这是2020.8.24开始的视觉AI训练营第一天的打卡内容,这篇学习笔记是对视频内容的复制。通过今天的学习,我重新认识了AI在图像领域(或者说视觉领域)的应用。之前的我只是学习深度学习,包括图像识别等。现在我了解了如何将AI应用到生成图像中去。

一、定义和分类

定义:通过一个/一系列视觉过程,产出新的视觉表达

  • 产出:人或机器能够感知的图像视频,而不是标签或特征
  • 要求:新的,和输入不一样
  • 用AI实现传统上设计师通过PS, MAYA等的工作
    分类:
  • 生成:从0到1
  • 拓展:从1到N
  • 摘要:从N到1,浓缩出主要信息
  • 升维:从An到An+1,例如2D→3D
  • 增强/变换:从A到B
  • 插入/合成:A+B=C
  • 擦除:A-B=C

image-20200924184108080.png

二、通用基础框架

  1. 请求:输入参数、素材、草案、成品(能不能做一个差不多的?)、案例
  2. 分发:生产类型

    1. 通用生成:参数+素材
    2. 素材合成:参数+素材
    3. 照图生图:参数+素材+成品
    4. 视频摘要:参数+素材+成品
    5. 编辑变换:参数+素材/案例
    6. 视觉拓展:参数+素材/案例
  3. 服务:视觉生产引擎(核心)

    1. 生成引擎:模型+知识
    2. 搜索引擎:素材+案例,生成困难,搜索匹配到一个差不多的,做一些改动
  4. 响应:输出图像/视频/3D
  5. </
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

请叫我孙善良

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值