多媒体工业引擎Air8101——主打AirUI(音频录制和播放、720P视频录制、720P LCD显示等)多媒体能力,同时也具备AirLink(Wi-Fi/以太网/蓝牙)联网能力,AirControl外设控制能力。
1、离线语音识别和在线语音识别的区别
离线语音识别和在线语音识别,二者的区别在于:
1.1 离线语音识别
需要预设自定义的一个唤醒词和几个命令词,也只能识别这些预设的唤醒词和命令词。最终我们会开放一个工具,让用户训练自定义的唤醒词和命令词。
1.2 在线语音识别
我们将会对接提供在线语音识别服务的云平台,例如:科大讯飞、云之声等。依托于云服务的能力,在线语音识别几乎可以将任何语音转换为文字。
如果你对语音识别有什么需求,欢迎在评论区留言。
2、Air8101十大音频支持能力
2.1 支持模拟音频输入:
两路模拟MIC音频输入通道,MIC1已经内置音频偏置电路,MIC2需要外置音频偏置电路,模拟音频采样率支持8KHz、16KHz、44.1KHz、 48KHz。
2.2 支持数字音频输入:
一路数字MIC音频输入通道,数字音频采样率最高支持384KHz。
2.3 支持模拟音频输出:
一路模拟音频输出通道,可以直接驱动耳机,如果要驱动喇叭,需要外置音频功率放大器。
2.4 支持多样化编解码:
PCM编解码
ADPCM编解码
WAV编解码
G711A编解码
G711U编解码
FLAC编解码
OPUS编解码
MP3解码
AAC解码
SBC解码(支持1个SBC硬件加速器)
OGG编解码
2.5 支持音频降噪:
AEC自适应回声消除、ANS自动降噪、AGC自动增益控制。
2.6 支持VAD语言活动检测;
2.7 支持第三方的离线语音识别算法;
2.8 支持TTS语音播放;
2.9 支持双向语音对讲;
2.10 支持GB28181协议规范。
3、多种应用场景
Air8101适用于AIoT领域的多种应用场景:
例如唤醒词检测和语音命令识别、人脸检测和识别、智能家居、智能家电、智能控制面板、智能扬声器、门锁、门铃等各种场合。