14、树莓派语音助手搭建全攻略

onion

于 2025-09-14 14:29:07 发布

阅读量50

点赞数

CC 4.0 BY-SA版权

分类专栏：树莓派智能家居实战文章标签：树莓派语音助手 Alexa

本文链接：https://blog.youkuaiyun.com/onion/article/details/151819155

树莓派智能家居实战专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

树莓派语音助手搭建全攻略

在科技飞速发展的今天，语音助手已经成为我们生活中不可或缺的一部分。借助树莓派，我们可以轻松打造属于自己的语音助手，如 Alexa 或 Google Assistant。本文将详细介绍如何在树莓派上搭建这些语音助手，以及如何进行相关的配置和集成。

1. 准备工作

在开始搭建之前，我们需要准备一些必要的硬件和软件。
- 硬件要求 ：
- 树莓派 3 或 4
- 至少 16GB 的 microSD 卡，并安装最新版本的树莓派操作系统
- USB 麦克风（如果没有，可以使用带有内置麦克风的 USB 网络摄像头，或者专门为树莓派设计的麦克风阵列 HAT）
- 带有 3.5mm 音频插孔的扬声器
- 软件要求 ：确保树莓派上安装了必要的软件包，如 wget、pip 等。

2. 安装 Alexa 语音服务

2.1 创建 Alexa 开发者账户

访问 Amazon 开发者网站，创建账户或登录已有账户。
点击 Alexa，进入 Alexa 语音服务控制台，然后点击“Manage Your Products”。
点击“Add New Product”，填写产品信息表单。
按照提示设置 AVS LWA 安全配置文件，点击“Create New Profile”，输入配置文件名称和设备描述，然后点击“Next”。
点击“Other Devices and Platforms”，输入客户端 ID，然后点击“Generate ID”。
下载 config.json 文件，完成开发者账户设置。此时，你可以在主控制台看到已注册的设备。

2.2 安装 AVS SDK

将下载的 config.json 文件移动到树莓派的 pi 目录。
打开终端，运行以下命令下载 SDK 配置脚本：

wget https://raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/setup.sh
wget https://raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/genConfig.sh
wget https://raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/pi.sh

运行安装脚本，使用以下命令：

bash setup.sh config.json [-s 1234]

确保 config.json 和 setup.sh 文件位于 /home/pi 目录。
4. 输入 AGREE 并按回车键（如果你同意 AVS 条款和条件）。此步骤可能需要 30 到 60 分钟，具体时间取决于树莓派型号和网络速度。在安装过程中，你将被提示查看许可协议，按回车键查看协议，然后输入 Yes 并按回车键继续。
5. 当终端显示 **** Completed Configuration/Build *** 时，安装完成。如果树莓派冻结且安装未完成，请拔掉树莓派电源，让其冷却 5 - 10 分钟，然后再次执行之前的 setup.sh 命令，安装过程应该会继续并完成。

2.3 启动 AVS 并进行身份验证

打开终端，执行以下命令：

bash startsample.sh

滚动终端输出，找到类似 To authorize, browse to: ‘https://amazon.com/us/code’ and enter the code: [your unique 6 - digit code here] 的行。在树莓派的 Chromium 浏览器中打开提供的链接，输入六位唯一代码，然后点击“Continue”，再点击“Allow”。
如果收到消息 “Success! Your registration is now complete”，则可以开始测试 AlexaPi。
你可以说 “Alexa, tell me the weather.” 进行测试。确保你已在 alexa.amazon.com 上设置了位置。如果 AlexaPi 能返回天气数据，恭喜你，你已成功打造了自己的支持 Alexa 的智能音箱。

3. Amazon Alexa 与 Home Assistant 集成

有几种方法可以将 Amazon Alexa 与 Home Assistant 结合使用：
- 创建专用智能家庭 Alexa 技能 ：可以创建一个专门的智能家庭 Alexa 技能来控制 Home Assistant 设备，或者构建带有自定义命令的技能。这涉及到 AWS Lambda 函数的实现和其他设置，你可以在 Home Assistant Amazon Alexa 文档页面找到相关信息。
- 使用 Emulated Hue 集成 ：该集成可以让 Alexa 认为 Home Assistant 是一个 Philips Hue 集线器。你需要在 configuration.yaml 文件中包含 emulated_hue: 和其他配置变量，这样 Home Assistant 和 Alexa 之间的虚拟桥梁就可以打开/关闭实体或更改可调光灯光的亮度。不过，这种方法仍在开发中，有时可能无法与 Google Assistant 配合使用。
- 使用 Home Assistant Cloud ：这是最流行的集成方法。你只需登录 HA 云，即可与 Amazon Alexa 建立安全连接，无需构建或配置任何技能。具体步骤如下：
1. 访问 Home Assistant 仪表盘，打开 configuration.yaml 文件，添加 cloud: 以启用 Home Assistant Cloud。
2. 进入配置面板，点击 Home Assistant Cloud，输入 Nabu Casa 凭证并启用你使用的语音助手。
3. 通过 Alexa 应用激活 Home Assistant 智能家庭技能。在手机上打开 Alexa 应用，进入技能页面，搜索 “Home Assistant Smart Home” 并添加。系统会提示你链接到 Nabu Casa 账户。
4. 链接过程完成后，你可以说 “Alexa, discover new devices” 让 Alexa 发现设备。在 Alexa 应用中，你将看到 Home Assistant 设备列表。你可以通过说出设备名称来控制设备，例如 “Alexa, turn on the office fan.”，同时在 Home Assistant 仪表盘上可以看到设备状态。

4. 使用 Platypush 创建自定义语音助手

Platypush 是一个运行在树莓派上的一体化语音自动化网关，它可以在树莓派上原生运行各种在线和离线语音助手，并可以轻松连接到任何集成任务以控制你的设备。

4.1 安装 Platypush

在树莓派上安装 Platypush 以及 Google Assistant 和 GPIO 集成和 Web 服务器：

sudo pip install 'platypush[http,google - assistant - legacy,rpi - gpio]'

这里的 “legacy” 是因为 Google 已正式弃用了助手库，截至目前尚未提供可行的替代方案。不过，编译后的库在树莓派 3 和 4 上仍然可以正常工作。

4.2 配置 Google 开发者账户

访问 Google 开发者控制台，创建一个新项目。
从凭证菜单下载关联的 credentials.json 文件到树莓派，例如 /home/pi/ga - credentials.json 。
安装 Google OAuth 库，使用以下命令进行账户认证：

sudo pip install --upgrade 'google - auth - oauthlib[tool]'
google - oauthlib - tool --scope https://www.googleapis.com/auth/assistant - sdk - prototype \
      --scope https://www.googleapis.com/auth/gcm \
      --save --client - secrets /home/pi/ga - credentials.json

如果树莓派没有连接显示器或鼠标，或者通过 SSH 运行，可以在上述命令中添加 --headless 选项。

4.3 配置 Platypush 以启用 Google Assistant 集成

创建一个新的配置文件，例如 /home/pi/platypush.conf ，并添加以下内容：

# Enable the web server
backend.http:
    enabled: True
# Enable both the assistant backend (for background
# listening) and plugin (for programmatic
# interaction)
backend.assistant.google:
    credentials_file: /home/pi/ga - credentials.json
assistant.google:
    enabled: True
gpio:
  mode: board
  pins:
    red_led: 18
    white_led: 32
    blue_led: 36

确保扬声器和麦克风已连接，然后从树莓派的 pi 主目录运行 Platypush：

platypush - c platypush.conf

如果一切正常，标准输出应该会显示以下行：

Received assistant event: ON_START_FINISHED
Received assistant event: ON_MEDIA_STATE_IDLE

此时，说 “OK Google” 应该可以触发语音助手。

5. 音频故障排除

在某些情况下，语音助手插件可能无法找到正确的音频输入或输出设备，特别是当扬声器和麦克风映射到两个不同的设备时。如果在标准输出中看到有关音频初始化的错误，你可能需要明确告诉系统应该使用哪个设备进行捕获和播放。
- 使用 PulseAudio ：如果系统正在运行 PulseAudio（可以使用 ps ax | grep pulseaudio 进行检查），可以从 pavucontrol 面板为每个应用程序配置音频接收器和源。
- 使用 ALSA ：使用 arecord - l 和 aplay - l 分别获取连接到树莓派的输入和输出音频设备的名称。对于每个设备，使用格式 “hw: , ” 构造一个字符串。例如，如果扬声器连接到卡 0 上的设备 1，麦克风连接到卡 2 上的设备 1，则它们的 ALSA ID 分别为 hw:0,1 和 hw:2,1 。然后在 /home/pi/.asoundrc 中创建一个用户音频配置文件，并粘贴以下内容：

pcm.!default {
  type asym
  # Default playback on hw:0,1
  playback.pcm {
    type plug slave.pcm "hw:0,1"
  }
  # Default capture on hw:2,1
  capture.pcm {
    type plug slave.pcm "hw:2,1"
  }
}
# Default output on audio card 0
pcm.output {
  type hw card 0
}

再次运行 Platypush，服务应该可以正常初始化。

6. 语音自动化

在使用 Platypush 中的语音助手集成一段时间后，你可能会注意到在语音会话期间会产生多个事件，例如对话开始、结束、识别到用户短语、处理助手响应、会话超时等。你可以为这些事件添加钩子（hooks）。
- 简单钩子示例 ：在 Platypush 配置文件中添加一个钩子，当你说 “OK Google” 时播放自定义声音：

event.hook.AssistantConversationStarted:
  if:
    type: platypush.message.event.assistant.ConversationStartEvent
  then:
    - action: shell.exec
      args:
        cmd: 'aplay /path/to/sound.wav'

复杂钩子示例 ：对于更复杂的自动化任务，使用 Python 代码可能更方便。首先，在与 Platypush 配置文件相同的文件夹中创建一个 scripts 目录，并创建一个空的 __init__.py 文件：

mkdir -p /home/pi/scripts
touch /home/pi/scripts/__init__.py

然后在该文件夹中创建一个名为 voice.py 的新文件，添加以下代码：

from platypush.event.hook import hook
from platypush.message.event.assistant import SpeechRecognizedEvent
from platypush.utils import run

@hook(SpeechRecognizedEvent,
      phrase='turn on ${color} light')
def light_on_voice_command(color, **kwargs):
  if color in ['red', 'white', 'blue']:
    run('gpio.write', value=True, pin=color + '_led')

通过以上步骤，你可以在树莓派上成功搭建和配置语音助手，并实现各种有趣的功能。希望本文能帮助你开启语音助手的探索之旅！

树莓派语音助手搭建全攻略（续）

7. 各语音助手及集成方式对比

8. 流程图展示

以下是使用 mermaid 格式绘制的树莓派搭建语音助手的整体流程图：

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([开始]):::startend --> B(准备硬件和软件):::process
    B --> C{选择语音助手类型}:::decision
    C -->|AlexaPi| D(创建 Alexa 开发者账户):::process
    C -->|Platypush| E(安装 Platypush):::process
    D --> E1(安装 AVS SDK):::process
    E1 --> E2(启动 AVS 并认证):::process
    E2 --> E3(测试 AlexaPi):::process
    E --> F(配置 Google 开发者账户):::process
    F --> G(配置 Platypush 启用 Google Assistant 集成):::process
    G --> H(运行 Platypush 并测试):::process
    E3 --> I{是否集成 Home Assistant}:::decision
    H --> I
    I -->|是| J(选择集成方式):::decision
    J -->|专用技能| K(创建技能及相关设置):::process
    J -->|Emulated Hue 集成| L(配置 configuration.yaml 文件):::process
    J -->|Home Assistant Cloud| M(启用 Home Assistant Cloud 并关联):::process
    K --> N(测试集成效果):::process
    L --> N
    M --> N
    I -->|否| O([结束]):::startend
    N --> O

9. 常见问题及解决办法

在搭建和使用树莓派语音助手的过程中，可能会遇到一些常见问题，下面为大家总结并提供解决办法：
- 安装过程中网络问题 ：
- 问题描述 ：在下载 SDK 配置脚本或进行账户认证时，由于网络不稳定导致下载失败或认证超时。
- 解决办法 ：检查网络连接，确保树莓派连接到稳定的网络。可以尝试更换网络环境，或者使用代理服务器（如果有）。
- 音频设备识别问题 ：
- 问题描述 ：语音助手插件无法找到正确的音频输入或输出设备，出现音频初始化错误。
- 解决办法 ：参考前面提到的音频故障排除部分，使用 PulseAudio 或 ALSA 进行音频设备配置。
- 账户认证失败 ：
- 问题描述 ：在进行 Alexa 或 Google 账户认证时，输入代码后提示认证失败。
- 解决办法 ：检查输入的代码是否正确，确保网络连接正常。如果问题仍然存在，尝试重新获取认证代码，或者查看账户设置是否有异常。
- 语音识别不准确 ：
- 问题描述 ：说出指令后，语音助手无法准确识别，或者识别结果与预期不符。
- 解决办法 ：检查麦克风是否正常工作，调整麦克风位置和音量。同时，确保语音清晰、语速适中。对于 Platypush，可以通过优化正则表达式规则来提高识别准确性。

10. 拓展应用思路

搭建好树莓派语音助手后，还可以进行一些拓展应用，让它发挥更大的作用：
- 智能家居控制拓展 ：除了控制灯光、风扇等基本设备，还可以连接智能门锁、智能窗帘等设备，实现更全面的智能家居控制。可以通过编写相应的控制代码，将语音指令与设备操作进行关联。
- 教育学习应用 ：利用语音助手进行知识问答、学习资料查询等。可以集成在线教育资源，让语音助手成为学习的好帮手。例如，当你说 “Alexa，查询数学公式” 或 “OK Google，查找历史事件” 时，语音助手可以提供相关信息。
- 娱乐互动应用 ：结合音乐播放软件或游戏平台，实现语音控制音乐播放、游戏启动等功能。例如，说 “Alexa，播放周杰伦的歌曲” 或 “OK Google，启动猜谜语游戏”。

通过以上的介绍，相信大家对在树莓派上搭建语音助手有了更全面的了解。按照步骤操作，你不仅可以拥有自己的语音助手，还能根据需求进行各种拓展和优化。希望大家在语音助手的世界里探索出更多的乐趣！