现在,语音助手已经成为了智能设备最基本的功能了,像智能手机、智能音响、智能机器人,甚至连学习机、家教机、儿童电子玩具等电子消费品都可以加入语音助手功能。语音助手在消费电子产品上的使用率正在稳步上升。
2017年以来,阿里、百度、京东、小米等巨头纷纷加入智能语音交互这一战场,这些巨头各有自己的智能语音产品。现在,语音交互已经成为人与设备之间进行交流的最常见方式了。语音交互也是最有效的沟通控制方式,帮助用户把家中的各终端设备无缝连接起来,让用户随时轻松控制家电或天气、新闻等信息。随着现在智能设备硬件技术的提升,设备的主控芯片已经变得越来越聪明了,能够更精准的听到和听懂用户的语言。不过,有国内芯片原厂专家表示:“语音助手的体验好不好,不仅只是依靠强大的云端数据库,更重要的应该是设备的拾音和解析技术,也就是解决方案里面的声音前处理技术。”

提到声音前处理技术,在国内比较领先的企业是耕耘音频产品20余年的芯片原厂炬芯科技。在音频领域,炬芯一直坚持“对声音体验的无限追求”的初衷,推出的智能蓝牙音频芯片备受国内外品牌商青睐,国外主要对接亚马逊智能语音平台,国内BAT平台也均有解决方案推出。炬芯的智能语音芯片已经被国际跟国内各个行业的巨头大量大量采用。

根据炬芯技术市场专家陶永耀先生的解释,声音应用的三个主要场景:声音的传输,例如打电话,通过声音传输,让通话功能实现;声音的存储,例如录音、播放 CD 等等;声音的识别,就是语音交互体验,而声音的前处理技术和声音的后处理技术就是上述场景实现的关键。
声音前处理技术其实是解决机器“听到”和“听清”两件事,从而达到“听懂”的目的。声音的“听到”主要依托的是麦克风。主要形式为单个麦克风或麦克风阵列(多个麦克风按照一定规则排列,在特定空间对声音进行获取和处理)。而基于麦克风的语音信号处理算法则是让声音“听懂”的关键。麦克风+算法,在不同的环境下排列组合,最终达到“听到”和“听懂”。

根据人机交互的距离,将声音的前处理分为分为远场拾音(3 到 5 米)和近场拾音(1 米内)。近场拾音,一般采用的是单麦克风,可在近距离、低噪声的情况下拾取符合语音识别需求的声音。但是一旦将智能手机放在有噪声的较远的距离,语音助手的识别率就会直线下降,单麦克风的局限就凸显了出来。远场拾音,由于距离、噪声、混响等因素,远场拾音多采用多麦克风阵列,并且和远场语音识别算法相匹配。

凭借多年来的沉淀,炬芯科技在声音领域取得了很大的优势,炬芯一直在做系统集成 SoC,让芯片硬件技术跟软件技术能够完美结合。凭借多年的经验,炬芯在声音采集的精度、速度上有很好的基础,并且通过声音处理算法硬件化等方式,能够将芯片的功耗和性价比维持在行业领先位置。
炬芯同时在加快智能语音产品的落地,现在主要的产品包括儿童录音笔、故事机、蓝牙音箱等等。在技术方面,主要包含了声音的降噪、回声消除技术、抗混响技术、在线语音识别。同时,炬芯也在拓展一些新领域,例如智能家居和智能家电领域。在这个方向上炬芯会更多的关注离线识别技术(离线语音技术可以避免在线技术网络不稳定、联网难、人的隐私被曝光等问题;并在较短反应时间内实现家电的控制)。最近炬芯在推广的智能耳穿戴产品,就融合了离线和在线的语音识别功能。炬芯可以通过有限的命令词条实现一些命令控制,也可以通过手机和云上识别,去实现一些语义理解命令。离在线结合的识别技术,将是未来技术发展的一个重要方向。

炬芯作为芯片行业的源头厂商,多年来深耕声音前处理技术,具有很深的技术沉淀,可以帮助方案商、终端厂商提升产品语音交互能力,推动更多的智能语音产品快速落地。