自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 数字人不限时长安装教程

模型选择与下载:推荐选用开源的无限时长数字人模型(如 SadTalker-lite、D-ID 开源版、ChatTTS+LivePortrait 组合),从 Hugging Face 或 GitHub 下载模型权重(需注意模型许可协议),将权重文件放入本地指定目录。无限时长生成:在界面中上传长文本 / 长音频(无时长限制),模型会自动分帧渲染数字人口型、表情与动作,再通过拼接算法生成完整的长时长数字人视频,可直接导出 MP4 格式。部署后通过修改配置参数优化性能,即可实现无时长限制的数字人生成。

2025-12-17 11:14:34 306

原创 视频字幕精确生成方法 用到字幕api开发文档

audio_urls 否 object {"audio_urls": ["https://xxx/xxx.mp3", "https://xxx/yyy.mp3"]} 批量音频 URL 数组,仅 type=start 时有效(免费测试仅支持 10 秒内音频)本文档将详细介绍如何调用 /api/stt/audiototexturls 接口完成音频转文字,并基于接口返回的时间轴数据生成 SRT 等格式的精准字幕,帮助开发者快速实现相关功能。二、开发步骤(Python 示例)

2025-12-17 11:07:33 387

原创 手持产品数字人生成 API 接口文档

ratio 是 string 画面比例<br>可选:16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3<br>默认:16:9 16:9。"status": "pending", // 状态: pending, processing, completed, failed。"url": "/video.mp4", // 结果文件下载地址。"status": "completed", // 任务状态。"progress": "0%" // 处理进度。

2025-12-05 10:11:49 342

原创 语音合成PRO版接口API新手文档(实时音频流base64编码)

本接口为语音合成 PRO 版,支持基于实时音频流的 base64 编码输出,可将传入的文本内容转换为指定音色、格式的音频,同时支持音量、语速、音调等参数自定义调整。关联的音频相关资源(如通过 “声音复刻 PRO” 生成的音色对应的音频文件、合成后输出的 MP3/WAV/PCM 格式音频),若后续需通过其他接口(如视频提取音频接口)进一步处理,需提前确认资源链接的公开可访问性,避免出现 “非公开视频无法访问”“网页解析失败,可能是不支持的网页类型” 等问题。待合成的文本内容,单次请求不超过 2000 字符;

2025-12-04 16:17:35 544

原创 全场景数字人智能交互解决方案

FastGPT支持:OpenAI(GPT系列)、Anthropic(Claude系列)、Gemini、Grok、通义千问、豆包、Deepseek、ChatGLM、文心一言、Kimi、MiniMax、讯飞星火、混元、阶跃星辰、零一万物等主流模型;无论是企业打造智能客服终端、政务大厅引导屏,还是商业场景的互动大屏、品牌数字人对话系统,AI实时对话数字人系统4.0.1版都能提供高效、灵活、可拓展的技术支撑,助力快速实现智能化升级。形象管理:支持自定义数字人形象名称、品牌LOGO、封面图,强化品牌辨识度;

2025-12-03 09:15:38 354

原创 ai配音系统源码开发功能表

它能够将任意文本转化为高度拟人、富有表现力的语音,广泛适用于视频制作、有声内容、广告宣传、教育培训等多种场景,极大地提升内容创作的效率与质量。它不仅提供了高质量的AI音色,更通过深度的播控功能,赋予创作者前所未有的细节把控力,让每一段合成语音都精准传达所需情感与专业度,真正实现“所想即所得”的语音创作体验。智能停顿:通过“插入停顿”与“段落静音”功能,自主控制语句间、段落间的间隔时长,使播报更符合听觉习惯。实时效果预览:“立即效果”功能允许用户在最终合成前,对调整后的片段进行试听,确保效果满意。

2025-12-03 09:13:44 126

原创 视频提取文案音频分离接口api开发文档

五、返回数据说明 (一)返回参数。AI视频分析接口开发文档 一、接口概述 本接口用于实现 AI 视频分析功能,支持传入视频地址信息(含短视频分享链接等),获取视频相关的提取文字信息、视频音频 URL 下载地址、视频封面地址等数据,助力开发者快速获取视频核心信息及相关资源。音频地址兼容性:返回的音频地址(如示例中的 https://#/#.mp3)可能存在格式支持问题,若需使用该音频资源,需提前确认接口支持的音频格式,避免出现解析失败情况(如前文提及的 MP3 链接解析失败问题)。

2025-12-02 08:52:38 375

原创 Ai歌曲翻唱api接口开发文档

本接口用于实现 AI 歌曲翻唱功能,支持通过传入音乐音频 URL、人声音频 URL 及回调 URL,获取翻唱任务 ID,后续可通过回调 URL 接收翻唱结果。(POST 请求时,参数需按 application/x-www-form-urlencoded 格式拼接在请求体中)回调 URL,用于接收翻唱任务的执行结果(需确保 URL 可正常接收回调请求)待翻唱的音乐音频 URL(需为 MP3 格式,确保 URL 可正常访问)(一)请求头(HEADER)接口执行耗时(单位:秒)(二)返回示例(成功)

2025-12-02 08:47:06 323

原创 实时对话数字人api接口新手教程

除了场景1里的key、type(这里填“chat”)、avatar_id、voice_id、robot_id,还要加“text”参数。| 接口密钥(key) | 登录“ kuhuyun 控制台”,在“密钥管理”里找 | 证明你是合法用户,接口才会理你 || 数字人形象ID(avatar_id) | 通过“克隆API”生成 | 决定数字人长什么样(比如是小虎还是小美) || 数字人音色ID(voice_id) | 通过“克隆API”生成 | 决定数字人说话的声音(比如是男声还是女声) |

2025-10-31 11:20:06 349

原创 Sora 2 视频生成 API 开发文档​

任务状态(仅查询任务时返回):- 0:创建中(视频生成未完成)- 1:创建成功(视频已生成,可通过 file_url 获取)- 2:创建失败(生成过程出错)​。请求类型:- create:创建视频生成任务- query:查询已有任务的结果​。4.2 示例 2:查询任务成功(状态为 “创建成功”,type=query)​。状态码:- 200:请求成功- 400:请求失败(如参数缺失、密钥错误等)​。4.3 示例 3:查询任务成功(状态为 “创建中”,type=query)​。

2025-10-28 09:44:25 387

原创 GEO系统源码 AI搜索优化系统源代码

当客户搜索相关需求时,品牌能即刻出现在搜索结果前端,达成“一搜就看到你”;客户提出疑问,AI可快速匹配品牌相关解决方案,做到“一问就有你”;通过权威信息呈现与口碑背书,增强客户信任,实现“一查就信你”;再以优质内容和清晰转化路径,促使客户产生行动,达成“一看就找你”。这套营销逻辑,让品牌与客户需求高效对接,大幅提升转化概率。在数字营销领域,SEO靠链接搭建流量入口,GEO则以精准答案直击需求核心。借助AI技术,可让品牌识别更精准,将品牌信息主动推荐给目标客户,实现营销效能升级。SEO是链接,GEO是答案。

2025-09-04 09:35:18 319

原创 数字人视频分辨率都有那些?

数字人视频竖屏分辨率:分辨率1280×720(720P),全高清(FHD)分辨率1920×1080(1080P),超清(QHD)分辨率2560×1440(2K/1440P),4K(UHD)分辨率3840×2160(4K UHD)数字人视频横屏分辨率:上面的分辨率反过来×即可。来源:酷虎云数字人api开放平台。数字人短视频分辨率介绍。

2025-08-29 09:20:10 153

原创 字幕识别 字幕转换api接口开发文档

酷虎云音频转文字(STT)接口开发文档 1. 接口概述本接口为酷虎云提供的音频转文字(Speech-to-Text, STT)服务接口,支持通过提交音频URL的方式批量发起转写任务,并可查询任务状态及获取转写结果(含可导出为SRT格式的字幕信息),适用于需要将音频内容转化为文本或字幕的开发场景。 2. 接口基础信息 项目 内容 -----------

2025-08-28 09:22:59 763

原创 交互式数智人

通过摄像头捕捉用户的面部图像,数字人可以根据面部表情、动作等信息,做出相应的反应和互动。无论用户身处办公室、家中还是其他任何有网络连接的地方,都能通过相应的终端设备,远程启动数字人、调整其各项参数以及安排其执行相关任务,极大地提高了使用的灵活性和便利性。用户可以设置绿幕的颜色、阈值等参数,确保数字人能够准确地从绿幕背景中分离出来,与其他背景或场景进行无缝合成,提升视频的质量和效果。数字人的动作、表情可以配合相应的动画效果,如入场动画、退场动画、交互动画等,使数字人的形象更加生动、鲜活,提升用户的视觉体验。

2025-08-18 10:38:49 456

原创 数字人接口源码

数字人api大模型云端部署后即可无限api访问数字人合成数字人创建调整数字人清晰度等,支持无限复制、无限新增并发。免费试用满意再购买。企业服务场景:例如智能客服(多线路同时接入)、虚拟会展(多数字人并行互动)等,需要灵活调整数字人参数(清晰度、形象等)以适配不同场景。如果需要进一步了解该服务的技术细节(如 API 文档、清晰度参数范围)、试用流程或付费方案,可关注其官方渠道获取具体信息。内容创作领域:如短视频批量生成、虚拟主播多账号运营、个性化数字人 IP 打造等,依赖高并发和无限复制能力提升效率。

2025-07-16 18:34:50 141

原创 超清数字人api接口

参数方面,key(接口密钥,必填)、video_url(视频 URL,必填,格式为 mp4/mov,大小 < 5GB,单人脸且无遮挡,面部占比≥1/4,分辨率 360p-4k,时长 5 秒 - 30 分钟)、callbackUrl(自定义回调 URL,选填)。返回参数含code(状态码,200 为正常)、msg(状态信息)、time(时间)、task_id(任务 ID)、model_id(数字人模型 ID)。训练结果可通过回调(POST 通知)或轮询(用任务 ID 查询)获取,视频需经授权且合规。

2025-07-15 10:44:49 344

原创 4K 超清数字人 API 接口

4K 超清数字人 API 接口(数字人分身短视频训练 API)支持快速训练专属数字人分身形象,可 1:1 复刻真人 4K 超清高保真数字人。接口提供免费使用权限(需实名认证),支持 2K/4K 高清数字人模型生成,适用于短视频制作、虚拟形象打造等场景。video_url 是 string https://*/1/1.mp4 视频 URL 地址,需满足格式及内容要求。若未设置回调 URL,需通过 “数字人训练 H⁺获取结果” 接口轮询训练状态,直至任务完成。

2025-06-18 14:34:51 610

原创 数字人API接口

以本文研究的接口为例,其核心功能为 数字人形象训练 ,即用户通过上传包含人脸的视频文件,调用后台算法完成面部特征提取、动作建模及语音同步等训练流程,最终生成可交互的数字人模型。| video_url | 是 | string | https://*/1/1.mp4 | 训练视频的网络地址,需满足MP4/MOV格式、小于5GB、单人脸等技术要求。

2025-06-09 10:05:32 733

原创 123数字人api接口

123数字人API接口提供数字人视频合成服务,支持通过音频和视频模板生成播报内容。核心功能包括任务提交(需提供音频URL和可选视频模板)和状态查询,返回视频URL等结果。参数要求包括接口密钥、音频文件(≤90分钟/2G)等,视频需满足≤3GB、mp4/mov格式等技术标准。接口返回结构包含状态码、任务ID和视频地址等信息,适用于虚拟主播、教育等多场景应用。

2025-06-06 11:43:40 290

原创 语音转文字 API 接口介绍

接口名称:语音转文本 API 标准版,也可称为语音转文字接口、音频转文本 API 接口、录音转文本 API 接口、链接转文案 API 接口、视频转文字 API 接口、视频音频转文案 API 接口。“audio_url”:必填,类型为 string,示例值如 https://#/#.mp3 ,为音频 url 地址,限 post 请求,支持 mp3、wav、ogg 等音频格式。GET 请求示例:/api/stt/audiototext?接口地址:/api/stt/audiototext。

2025-04-24 10:41:08 810

原创 文字转语音 API 接口介绍

接口名称:文字转语音 API 标准版,也可称为文本转语音 API 接口、文本转音频接口、文字转音频 API 接口、文字转声音 API 接口、实时文字转语音接口、流式语音合成接口。以下是一个示例,通过 GET 方式请求接口:/api/tts/texttoaudio?“voiceName”:指定想要的语音音色 ID,可根据需求选择不同的音色。示例代码:提供了可供参考的代码示例,帮助开发者快速上手使用接口。接口地址:/api/tts/texttoaudio。API 文档:可查看详细的接口使用说明和规范。

2025-04-24 10:37:46 1012

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除