
语音应用框架设计
介绍各个公司的语音SDK以及对语音框架的设计
coder.mark
物联网、智能语音设备、嵌入式从业者,关注工作号《1024嵌入式》
展开
-
语音交互中ONESHOT设备端实现
一、目的之前的几篇博文中我们介绍了语音交互框架、语音SDK设计,本篇博文中重点介绍语音交互中的ONESHOT设计。那什么是语音ONESHOT呢?简单的讲,就是用户唤醒词与要识别的内容连说。传统的语音交互模式一般是这种情形:你好小乐(--唤醒提示音播放--提示音播放完毕--)我想听歌---等待对话结果 播放提示音期间不拾音此种交互方式的优点是语音唤醒后,由于先放唤醒提示音,此过程中设备不拾音,所以不会误拾音;当然缺点也很明显,对于急性子的用户,可能没等提示音播放完毕.原创 2020-11-11 17:43:14 · 3788 阅读 · 4 评论 -
语音SDK设计篇
一、目的前一篇博文中我们提交语音交互框架设计,那如何设计一个语音SDK呢?本篇博文会给出一些建设性意见和参考设计。二、框架上图中每个实心圆代表每个线程,完成对应的功能;需要特别说明的是信号处理与唤醒,有些厂商这两个模块可能已经做好集成,呈现给开发者的接口封装了内部逻辑,对话只需要关心语音输出和相关事件。上图中调度器也就是本文的核心,来实现上可以是行为树也可以是状态机,本文着重介绍状态机的实现方式。三、设计调度器顾名思义就是根据输入进行相关调度处理,保证其他各个线程都是按照指定逻辑原创 2020-11-11 16:55:37 · 1071 阅读 · 1 评论 -
语音交互框架设计-初始篇
一、目的随着人工智能技术的不断发展,语音识别、图像识别、人机交互这几年越来越成为热门。作者从业于人工智能语音公司多年,简单聊聊设备端语音交互框架设计。二、设计一般语音交互类产品中会涉及到语音唤醒、语音识别、语义识别、对话理解、语音合成等相关技术,对于这些技术细节博主不是这方面的专业人员了解的不多,但这并不影响应用开发人员去设计一个语音交互框架。一个完整的语音交互类产品一般分为一下模块,如图:...原创 2020-11-11 14:53:11 · 2483 阅读 · 0 评论