1. 写在最前面
为了 Fix 语音转文字(STT)产品在 Json 协议支持上的问题,笔者需要将推送到 RTC 的数据按照正确的格式进行解析,并且确认收到内容符合 Fix 的产品要求。
注:RTC 实时音视频,即 RTC(Real-Time Communication),是一种实时通信技术,它允许计算机、网络设备或移动设备之间进行音频、视频或数据交换。RTC 的核心是交流,强调对语义信息进行高质量和高效率的传递。借助 RTC,用户可以进行基本的音视频通话,实现线上交流的目的。
语音转文字,可以将指定的 RTC 频道的语音识别成对应的文字,并将对应的文字推送回频道,效果参考下图。
1.1 旧测试流程
-
开启一个 RTC 频道
-
针对该频道开启 STT 任务
-
确认 RTC 频道是否有收到 STT 任务识别的结果
1.2 新测试流程
本着优化旧版本测试流程过程的目标 + 刚好过年前期业务压力没有过分紧张,笔者借助「copilot + cursor」的 AI 编程能力,实现了一个支持基于「RTC + STT」的极简版 Web demo。
效果如下:

注:不要问为什么用了两个 AI 编程助手,因为 cursor 免费的体验消耗完成了,但是 demo 还没完成

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



