在ROS中使用中文语音交互（百度语音baidu_speech）

最新推荐文章于 2025-09-21 00:05:23 发布

原创最新推荐文章于 2025-09-21 00:05:23 发布 · 6.5k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#ROS #语音识别 #baidu_speech

ROS_kinetic机器人操作系统同时被 3 个专栏收录

106 篇文章

订阅专栏

课程-智能机器人综合实践-

27 篇文章

订阅专栏

课程-人机智能交互技术-

12 篇文章

订阅专栏

本文介绍了一款基于ROS的百度语音API功能包，该工具支持语音识别与TTS功能，并适用于英语、普通话及粤语等多种语言环境。文章详细阐述了安装步骤、软件硬件需求、功能包编译及使用方法。

目前，ROS可以用的中文语音工具还是有一些的，功能也越来越丰富，但有一些有使用的限制，有一些用起来不是很方便。

这里以百度语音为例具体说明，参考链接如下：

1 http://wiki.ros.org/baidu_speech

2 https://github.com/DinnerHowe/baidu_speech

----

1. 概述

使用百度语音API实现语音识别和TTS的功能包，可以修改或自定义参数的示例代码。在开始本教程之前需要保证安装完成两个必须的Python库pyaudio和python-vlc。这个功能包提供了在ROS中使用百度语音的解决方案，可以同时应用于英语、汉语普通话和粤语，经过多台配置电脑的测试，包括indigo和kinetic，thinkpad、acer等。

注意：

$ sudo apt-get install python-pip portaudio19-dev vlc libvlc-dev

$ sudo pip install pyaudio

$ sudo pip install python-vlc

----

2. 软硬件需求

可以运行ROS的笔记本或硬件设备，麦克风和扬声器等并正确配置。

----

3. 功能包下载并编译

这个和之前所有ROS包非常类似。

relaybot@relaybot-desktop:~/Rob_Soft/Baidu_Speech$ catkin build

----------------------------------------------------------------------------
Profile:                     default
Extending:          [cached] /home/relaybot/catkin_ws/devel:/opt/ros/kinetic
Workspace:                   /home/relaybot/Rob_Soft/Baidu_Speech
----------------------------------------------------------------------------
Source Space:       [exists] /home/relaybot/Rob_Soft/Baidu_Speech/src
Log Space:          [exists] /home/relaybot/Rob_Soft/Baidu_Speech/logs
Build Space:        [exists] /home/relaybot/Rob_Soft/Baidu_Speech/build
Devel Space:        [exists] /home/relaybot/Rob_Soft/Baidu_Speech/devel
Install Space:      [unused] /home/relaybot/Rob_Soft/Baidu_Speech/install
DESTDIR:            [unused] None
----------------------------------------------------------------------------
Devel Space Layout:          linked
Install Space Layout:        None
----------------------------------------------------------------------------
Additional CMake Args:       None
Additional Make Args:        None
Additional catkin Make Args: None
Internal Make Job Server:    True
Cache Job Environments:      False
----------------------------------------------------------------------------
Whitelisted Packages:        None
Blacklisted Packages:        None
----------------------------------------------------------------------------
Workspace configuration appears valid.
----------------------------------------------------------------------------
[build] Found '1' packages in 0.0 seconds.                                     
[build] Package table is up to date.                                           
Starting  >>> baidu_speech                                                     
Finished  <<< baidu_speech                [ 0.5 seconds ]                      
[build] Summary: All 1 packages succeeded!                                     
[build]   Ignored:   None.                                                     
[build]   Warnings:  None.                                                     
[build]   Abandoned: None.                                                     
[build]   Failed:    None.                                                     
[build] Runtime: 0.5 seconds total.

----