直播抠图技术100谈之10--为什么光打的好, 抠的就好。

部署运行你感兴趣的模型镜像
  • 因为人站在绿布面前,打光不好的话, 绿色会反射到人身上, 在边缘区域还是很明显, 但如果是黑色的头发,在实际的像素点上, 这个人肉眼看起来是黑色的部分, 实际上暗绿色;看不太清楚, 但等抠图完毕后叠加上别的背景,这个暗绿色就很明显了。
    如下图:肉眼看起来是黑色,但实际是暗绿色,RGB值(16,119,25)妥妥的是暗绿色;
    在这里插入图片描述

肉眼看起来是黑色,但实际是暗绿色,RGB值16,119,25

  • 这个绿色是不能抠的, 因为头发是细节, 抠了整个人像会特别的不自然;但又不能把暗绿色的头发完整的保留,因为叠加上别的背景,这个暗绿色就绿的很明显了。

这时有两种解决办法,

  1. 溢色, 就是把头发的颜色还原成黑色; 但如果女主播的头发是黄色,红色或其他颜色,则不是很好还原, 需要人工手动局部调节;
  2. 说到根本了, 打光好的话, 可以省去大部分的软件调试时间;

这就有一个疑问了, 为什么不能用AI来识别这些物体,做到完全的不抠并很好的溢色呢;

  • 这是因为大部分的直播间,都是3个小时以上的直播, 现在AI在处理1080P或4k的图像上,速度还没有那么快,并且还需要推流直播,直播伴侣等各平台又很耗资源,大部分站播的场景还需要60帧每秒;抠图算法本身也需要精细耗时处理,再加上AI,即使最快的yoloV8-seg这样的模型, 一般的显卡勉强在1080P时做到10ms左右;并且要长时间运行,电脑会长时间高压力运行,时间长了温度会上升, 温度上升会导致各种异常,比如画面卡顿,画面割裂等等。

总结:

  • 打光好, 可以省去一大部分图像软件调试工作;

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

STM32电机库无感代码注释无传感器版本龙贝格观测三电阻双AD采样前馈控制弱磁控制斜坡启动内容概要:本文档为一份关于STM32电机控制的无传感器版本代码注释资源,聚焦于龙贝格观测器在永磁同步电机(PMSM)无感控制中的应用。内容涵盖三电阻双通道AD采样技术、前馈控制、弱磁控制及斜坡启动等关键控制策略的实现方法,旨在通过详细的代码解析帮助开发者深入理解基于STM32平台的高性能电机控制算法设计与工程实现。文档适用于从事电机控制开发的技术人员,重点解析了无位置传感器控制下的转子初始定位、速度估算与系统稳定性优化等问题。; 适合人群:具备一定嵌入式开发基础,熟悉STM32平台及电机控制原理的工程师或研究人员,尤其适合从事无感FOC开发的中高级技术人员。; 使用场景及目标:①掌握龙贝格观测器在PMSM无感控制中的建模与实现;②理解三电阻采样与双AD同步采集的硬件匹配与软件处理机制;③实现前馈补偿提升动态响应、弱磁扩速控制策略以及平稳斜坡启动过程;④为实际项目中调试和优化无感FOC系统提供代码参考和技术支持; 阅读建议:建议结合STM32电机控制硬件平台进行代码对照阅读与实验验证,重点关注观测器设计、电流采样校准、PI参数整定及各控制模块之间的协同逻辑,建议配合示波器进行信号观测以加深对控制时序与性能表现的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值