语音识别与语音控制的原理介绍

硬件平台

机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版

运行案例

首先进入originbot主控系统,运行以下指令。请注意,部分操作在originbot中暂未放入,请根据内容进行适当处理。

代码语言:JavaScript

代码运行次数:0

cd /userdata/dev_ws/# 配置TogetheROS环境source /opt/tros/setup.bash# 从tros.b的安装路径中拷贝出运行示例需要的配置文件。cp -r /opt/tros/lib/hobot_audio/config/ .# 加载音频驱动,设备启动之后只需要加载一次bash config/audio.sh# 启动launch文件ros2 launch speech speech_recongnition_launch.py

其中speech_recongnition_launch.py文件内容如下:

代码语言:JavaScript

代码运行次数:0

from launch import LaunchDescriptionfrom launch.actions import DeclareLaunchArgumentfrom launch.substitutions import LaunchConfigurationfrom launch_ros.actions import Node

def generate_launch_description():

启动音频采集pkg

audio_get = Node(    package='hobot_audio',    executable='hobot_audio',    output='screen',    parameters=[        {"config_path":"./config"},        {"audio_pub_topic_name": "audio_smart"}    ],    arguments=['--ros-args', '--log-level', 'error'])return LaunchDescription([    audio_get])

此时出现如下报错是因为没有语音唤醒,说出“地平线你好”后,即可唤醒。

语音识别与语音控制的原理介绍

报错:当人依次在麦克风旁边说出“地平线你好”、“向左转”、“向右转”、“向前走”、“向后退”命令词,语音算法SDK经过智能处理后输出识别结果,log显示如下:

语音识别与语音控制的原理介绍

识别到语音命令词“向前走”、“向左转”、“向右转”、“向后退”,并且输出DOA的角度信息,如recv hrsc sdk doa data: 110字段表示DOA角度为110度。

语音控制

SSH连接OriginBot成功后,配置智能语音模块:

代码语言:JavaScript

代码运行次数:0

# 从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。

cp -r /opt/tros/lib/hobot_audio/config/ .

加载音频驱动,设备启动之后只需要加载一次

bash config/audio.sh

灵机语音 灵机语音

灵机语音

灵机语音 56 查看详情 灵机语音

启动机器人底盘,在终端中输入如下指令,启动机器人底盘:

代码语言:JavaScript

代码运行次数:0

ros2 launch originbot_bringup originbot.launch.py

启动语音控制,以下是口令控制功能的指令:

代码语言:JavaScript

代码运行次数:0

ros2 launch audio_control audio_control.launch.py

此时即可看到小车运动的效果。

以上就是语音识别与语音控制的原理介绍的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/463686.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 04:35:44
下一篇 2025年11月8日 04:36:50

相关推荐

发表回复

登录后才能评论
关注微信