自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 freeswitch 使用 endpoint 实现对接 ASR,TTS

原始的freeswitch 实现ASR,TTS对接需要使用 MRCP服务,但是对于第三方来说不一定支持,需要自己实现MRCP中间件来对接,还有就是控制播放问题,过程比较麻烦,而且想要做到定制类型功能时不一定很容易实现,交互也比较难做。robot_outgoing_channel 用来创建 session,构造 codec,TTS 播放线程等。robot_io_routines 是endpoint 控制接口。robot_read_frame 用来播放语音内容。

2025-05-05 12:56:19 935

原创 freeswitch 如何实现回铃音检测功能

回铃音的检测可以使用 ASR 去做,只需要实现一个 mod 然后监听回铃音状态的数据,然后将数据送到 ASR服务识别就可以,但是这样的方案有一个非常大的弊端,就是 ASR 无论用哪一种性能都太差,而且对机器配置要求极高。使用方法也很简单,自己先通过录音抓去回铃音数据,然后通过 audio_clip 工具,对数据进行裁剪,裁剪后的每一个片段就相当于一个标注文件。回铃音的识别场景是非常狭窄的,没有环境音干扰,声音频率也比较稳定,这种场景如果使用 ASR的话只能用来糊弄客户,领导。相当于杀鸡用导弹一样。

2025-04-05 23:50:44 580 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除