阿里视觉AI训练营-day01

最新推荐文章于 2024-05-02 11:50:09 发布

爱学习的赵同学呀

最新推荐文章于 2024-05-02 11:50:09 发布

阅读量248

点赞数 1

分类专栏：阿里视觉生成阿里进阶训练营阿里高校计划文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/qq_39706369/article/details/109391447

版权

阿里进阶训练营同时被 3 个专栏收录

11 篇文章

订阅专栏

阿里视觉生成

4 篇文章

订阅专栏

阿里高校计划

4 篇文章

订阅专栏

本文详细介绍了视觉生产技术，包括定义、分类，重点讲解了分割抠图的难点与解决策略，视觉生成在电商设计中的应用，以及视觉编辑中的视频植入技术和视觉增强技术，最后提到了智能开放平台的角色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

视觉生产技术

一.定义和分类：

1.1.定义：通过一个/一系列视觉过程，产出新的视觉表达。

产出：人或机器能够感知的图像视频，而不是标签或特征；
要求：新的，和输入不一样的

在这里插入图片描述

1.2.分类：

在这里插入图片描述

1.3.通用基础框架

在这里插入图片描述

1.4.五个关键维度

满足视觉/美学表现
合乎语义/内容逻辑
保证结果的丰富性
提供用户预期的抓手【可控】
带来用户/商业价值【可用】

二.精细理解

2.1.分割抠图

识别：知道是什么？
检测：识别 + 知道在哪儿
分割：识别 + 检测 + 知道每一个像素是什么

2.2.分割抠图—难点

复杂背景
发丝精扣
透明材质
遮挡
边缘反色
多尺度/目标

数据严重不足，标注成本高

在这里插入图片描述

2.3.分割抠图–解题思路

在这里插入图片描述

复杂问题拆解：粗mask设计 + 精准matting
丰富数据样本：设计图像mask统一模型

2.4.分割抠图–模型框架

在这里插入图片描述

2.5.分割抠图–人像抠图

在这里插入图片描述

2.6.分割抠图–物体抠图拓展

在这里插入图片描述

2.7.分割抠图——场景抠图

在这里插入图片描述

三.视觉生成

3.1视觉生成–框架流程

在这里插入图片描述

3.2.视觉生成–电商设计

照图生图
个性化设计

3.3.视觉生成–鹿班场景智能美工

IN：营销场景+原始素材
OUT：营销图片
调用方式：API

3.4.视觉生成–AlibabaWood

一键生成短视频：AlibabaWood
在这里插入图片描述

3.5.视觉生成–框架流程

在这里插入图片描述

四.视觉编辑–移花接木

4.1.视频植入

目前大部分广告都是与内容无关的，对用户不太友好，视频植入手段可将广告植入到视频中，提升用户体验

4.2.视觉编辑——植入位检测与定位

在这里插入图片描述

4.3.视觉编辑——动态检测分割

单独分割
遮挡关系等

4.4.视觉编辑——视频内容擦除

在这里插入图片描述

4.5.视觉编辑——文字擦除

在这里插入图片描述

4.6.视觉编辑——图像尺寸变化

在这里插入图片描述

五.视觉增强——修旧如新

5.1.视觉增强——视频增强

在这里插入图片描述

5.2.视觉增强——人脸修复增强

在这里插入图片描述

5.3.视觉增强——风格迁移

在这里插入图片描述

5.4.视觉增强——颜色拓展

在这里插入图片描述

六.智能开放平台

在这里插入图片描述