Porcupine语音唤醒引擎Python演示教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00295/article/details/148548985

Porcupine语音唤醒引擎Python演示教程

porcupine On-device wake word detection powered by deep learning 项目地址: https://gitcode.com/gh_mirrors/po/porcupine

什么是Porcupine

Porcupine是一款高精度、轻量级的语音唤醒引擎，由加拿大温哥华的Picovoice公司开发。它能够让开发者构建始终在线的语音交互应用，具有以下显著特点：

采用在真实环境中训练的深度神经网络，识别准确率高
体积小巧且计算高效，特别适合物联网设备
可扩展性强，能同时检测多个唤醒词而不增加CPU/内存负担
支持自定义唤醒词训练，开发者可以自主创建个性化唤醒短语

环境要求

Python 3.9及以上版本
支持平台包括：
- Linux (x86_64)
- macOS (x86_64和arm64)
- Windows (x86_64, arm64)
- 树莓派 (Zero, 3, 4, 5)

安装演示包

使用pip命令安装Porcupine演示包：

sudo pip3 install pvporcupinedemo

获取授权凭证

使用Porcupine需要有效的授权凭证作为验证。授权凭证可以通过注册Picovoice控制台免费获取，请妥善保管您的授权凭证。

使用指南

麦克风实时检测演示

这个演示会打开默认麦克风并检测指定的唤醒词。以下是检测"Picovoice"唤醒词的基本命令：

porcupine_demo_mic --access_key ${AUTH_KEY} --keywords picovoice

常用参数说明

多唤醒词检测：可以同时检测多个唤醒词

porcupine_demo_mic --access_key ${AUTH_KEY} --keywords picovoice porcupine

自定义唤醒词：使用通过控制台创建的自定义唤醒词模型

porcupine_demo_mic --access_key ${AUTH_KEY} --keyword_paths ${KEYWORD_PATH_ONE} ${KEYWORD_PATH_TWO}

非英语唤醒词：需要指定对应的语言模型路径

porcupine_demo_mic --access_key ${AUTH_KEY} --model_path ${NON_ENGLISH_MODEL_PATH} --keyword_paths ${NON_ENGLISH_KEYWORD_PATH}

音频设备问题排查

如果遇到麦克风无法正常工作的情况，可以按照以下步骤排查：

查看可用音频设备列表：

porcupine_demo_mic --show_audio_devices

根据输出结果选择正确的设备索引：

porcupine_demo_mic --access_key ${AUTH_KEY} --keywords picovoice --audio_device_index 0

如果问题仍然存在，可以将录音保存为文件进行检查：

porcupine_demo_mic --access_key ${AUTH_KEY} --keywords picovoice --audio_device_index 0 --output_path ~/test.wav

音频文件检测演示

这个演示主要用于在预先录制的音频文件上进行性能测试和基准评估。它支持16kHz采样率的单声道音频文件（如果是立体声文件，只处理左声道）。

基本使用命令：

porcupine_demo_file --access_key ${AUTH_KEY} --wav_path ${AUDIO_PATH} --keywords picovoice

高级功能

灵敏度调节：可以针对每个唤醒词单独设置灵敏度(0-1之间)
```
porcupine_demo_file --access_key ${AUTH_KEY} \
--wav_path ${AUDIO_PATH} \
--keywords grasshopper porcupine --sensitivities 0.3 0.6
```
灵敏度参数用于平衡漏检率和误报率，数值越高，漏检率越低但误报率会相应提高。

非默认唤醒词检测：

porcupine_demo_file --access_key ${AUTH_KEY} \
--wav_path ${AUDIO_PATH} \
--keyword_paths ${KEYWORD_PATH_ONE} ${KEYWORD_PATH_TWO}

非英语唤醒词检测：

porcupine_demo_file --access_key ${AUTH_KEY} \
--wav_path ${AUDIO_PATH} \
--model_path ${NON_ENGLISH_MODEL_PATH} \
--keyword_paths ${NON_ENGLISH_KEYWORD_PATH}