概览
视频主体突出方案 On-App AI
痛点分析
当前监控系统存在显著问题:
- 主体占比过低:广角镜头配合高位安装,导致拍摄主体在画面中占比不足;
- 细节辨识困难:关键主体因尺寸过小而无法清晰识别;

解决方案
- 目标检测:通过移动端AI实时识别画面主体;
- 智能放大:采用图像算法对目标区域进行自适应放大;
- 视频处理:完成编码封装后输出优化视频;

核心优势
- 精准聚焦:自动识别并突出画面主体;
- 智能处理:全流程自动化无需人工干预;
- 高效运算:适配主流移动端计算能力;
应用场景
| 场景类型 | 典型应用 |
|---|---|
| 家庭监护 | 婴儿看护/宠物监控 |
| 户外记录 | 喂鸟器/狩猎摄像机 |
| 自然观测 | 日出日落记录 |
前置知识
商务依赖
产品商务合作依照涂鸦增值服务商务流程执行。
如需了解更多关于 AI 能力的内容,请 提交工单 咨询。
开发依赖
小程序开发
- App依赖:涂鸦智能、智能生活App版本为 6.5.0 及以上;
- 小程序模版依赖:视频流隐私保护 API 集成于 IPC 精彩时刻小程序模版
- IPC 精彩时刻通用方案介绍,可查阅IPC 精彩时刻通用方案介绍
- IPC 精彩时刻小程序模版相关开发细则请参考IPC 精彩时刻小程序模版接入指南
设备 SDK 开发
涂鸦 AI 视频流方案基于涂鸦智能 IPC 功能基础。使用视频流 AI 方案,需要先对接 IPC SDK,设备端方案请参考 IPC_SDK 开发。
能力集
视频文件导入导出能力
导入本地视频资源
-
功能:主要支持 C 端用户通过以下两种途径进行视频素材的导入:
-
1.直接唤醒手机相机录制视频素材。
-
2.导入手机相册内已有视频素材。
-
接口详情:chooseMedia
视频预标准化处理
-
功能:主要用于格式化源视频资源分辨率与角度,避免不同分辨率与角度造成后续AI处理流程中出现异常情况。
-
接口详情:clipVideo
视频 AI 生成后导出
-
功能:主要用于支持 C 端用户完成视频素材编辑后将视频转存至手机相册。
👉 AI开发入口
音频交互相关能力
获取涂鸦默认背景音乐
-
功能:目前模版提供部分默认背景音乐供开发者获取、使用,后续音乐内容将进行扩充。
-
接口详情:backgroundMusicList
下载涂鸦默认背景音乐
-
功能:下载涂鸦在线背景音乐至app本地沙盒。
音乐资源控制实例
-
功能:主要用于播放、暂停背景音乐,用于用户试听体验。
AI 视频流处理功能
创建 AI 视频流处理实例 On-App AI
-
功能:初始化AI 视频流处理实例
-
接口详情:objectDetectCreate
销毁 AI 视频流处理实例 On-App AI
-
功能:销毁AI 视频流处理实例,避免内存泄漏
-
接口详情:objectDetectDestroy
宠物\人像主体突出、视频流背景音乐编辑 On-App AI
-
功能:
- 1.根据入参,对视频流中相应主体进行突出处理。
- 2.根据背景音乐素材以及混音比例,为视频新增自定义背景音乐。
-
接口详情:objectDetectForVideo
取消视频流编辑操作 On-App AI
-
功能:中断正在进行中的AI 视频流处理操作
AI 处理进度监听函数 On-App AI
-
功能:监听目前AI 视频流的生成进度
取消 AI 处理进度监听函数 On-App AI
-
功能:取消AI 视频流生成进度监听函数
教程内容
基础入门开发
关于如何入门小程序面板开发,如果您是第一次接触小程序,请参考本教程开始入手 详情。
AI 视频流主体突出
关于如何开发 AI 视频流主体突出功能示例模版,请参考 详情。
关键依赖模块
-
区域:
- 全区可用
-
App 版本:
- 涂鸦 App、智能生活 App v6.5.0 及以上版本
-
Kit 依赖:
- BaseKit: v3.0.6
- MiniKit: v3.0.1
- DeviceKit: v4.0.8
- BizKit: v4.2.0
- AIKit: v1.1.0
- baseversion: v2.26.7
-
组件依赖:
- @ray-js/panel-sdk: "^1.13.1",
- @ray-js/ray: "^1.6.29",
- @ray-js/ray-error-catch: "^0.0.25",
- @ray-js/smart-ui: "^2.1.5",
- @ray-js/cli: "^1.6.1",
概述
示例模版是为了降低开发者接入 App AI 的难度,整理了通用的视频处理能力并对外提供相应的示例源码。

模版主要涵盖功能
-
视频基本交互功能:
- 视频导入
- 视频导出
- 视频首帧渲染
- 视频播放暂停
- 视频进度条
-
音频基础交互功能:
- 获取默认背景音乐
- 展示默认背景音乐列表
- 试听默认背景音乐
-
AI 视频流处理功能:
- 宠物主体突出(支持猫、狗、鸟等 80 余种动物)
- 人像主体突出
- 视频流添加背景音乐
- 调节混音(视频原声、背景音乐)权重
附录
模块集
视频资源导入
AI视频开发方案,资源导入步骤
功能介绍
视频资源在初始化导入阶段依赖以下两个关键能力:
-
1.用户素材采集
- chooseMedia :支持C端用户通过实时录制视频或从手机相册导入的方式,提交原始视频素材。
-
2.视频预标准化处理
- clipVideo :自动统一源视频的分辨率与角度,避免因格式差异导致后续AI视频生成流程出现异常。
交互流程

注意事项
-
1.在使用 chooseMedia API时,为更好的兼容IOS、安卓双端系统,请默认将参数 isFetchVideoFile 传入true;
-
2.在使用 clipVideo API时
- (1)参数 endTime 的时间单位为毫秒,而 chooseMedia API返回的视频时长为妙,请注意单位转换;
- (2)参数 level 表示目标视频的压缩分辨率等级:
- 1 代表480854 码率:15721000
- 2 代表540960 码率:21281000
- 3 代表7201280 码率:31451000
- 4 代表10801920 码率:35001000
- 为确保输出视频的清晰度,此入参建议选用4。
导出视频资源
AI视频方案开发,导出视频资源教程
功能介绍
生成的 AI 视频可通过 saveVideoToPhotosAlbum 方法一键导出,并自动保存至系统相册,方便用户后续查看或分享。
交互流程

获取本地音乐列表
功能介绍

当前涂鸦为开发者提供了部分默认背景音乐资源,可直接获取并使用。我们将持续扩充音乐库内容,以满足更多场景需求。 默认背景音乐的获取与使用主要分为以下两个步骤:
-
获取在线音乐地址
开发者可通过 backgroundMusicList API 获取默认背景音乐的在线访问地址。 -
下载至本地存储
获取地址后,可组合使用系统环境变量env、backgroundMusicDownloadAPI 将音乐文件下载至手机本地,供后续使用。
提示:我们建议开发者在下载完成后对音乐文件进行本地缓存管理,以优化用户体验。
交互流程
试听背景音乐
AI视频开发,试听背景音乐
功能介绍
方案样例提供 LocalMusicList 组件,用于:
- 背景音乐列表展示
- 背景音乐试听功能
音乐试听功能基于 InnerAudioContext 实例实现,支持完整的音频控制能力,请参考 详情;
InnerAudioContext 实例核心功能
基础控制
- 【InnerAudioContext.paly】:播放音频
- 【InnerAudioContext.pause】:暂停音频
- 【InnerAudioContext.stop】:停止音频
- 【InnerAudioContext.resume】:恢复播放
- 【InnerAudioContext.seek】:跳转到指定时间点(单位:秒)
事件监听
- 【InnerAudioContext.onTimeUpdate】:实时获取播放进度更新(注:进度数据由系统返回,iOS/Android可能存在差异)
资源管理
- 【InnerAudioContext.destroyPlayer】:支持手动销毁音频实例(建议在组件卸载时主动销毁)
交互流程

注意事项
-
1.单个页面建议复用同一个
InnerAudioContext实例; -
2.进度监听需考虑平台差异性;
-
3.及时销毁不再使用的实例;
AI 视频流处理能力 On-App AI
AI视频流处理能力开发步骤
功能介绍
AI视频流处理能力主要提供两个核心功能模块:智能主体增强与智能音频处理。
智能主体增强
- 功能描述:支持对宠物、人像等特定主体的智能识别与视觉增强
- 交互方式:
- 用户可自主选择需要突出的主体类别
- 系统自动完成目标跟踪与视觉优化处理
智能音频处理
- 混音控制:
- 可视化音量调节界面
- 原声/背景音乐比例可调(0-100%线性调节)
- 输出选项:
- 保留原声
- 仅背景音乐
- 混合音频输出
交互流程
注意事项
- 目前主体选择仅支持:宠物/人像两类;
- 混音比例范围:0%-100%(默认原视频声音与背景音乐各50%);
- 代码实践 请参考 视频流主体突出模版详情。


900

被折叠的 条评论
为什么被折叠?



