- 博客(5)
- 收藏
- 关注
原创 基于科大讯飞流式语音听写的ROS机器人语音控制方案
作者在网上找到了一些ros机器人的语音控制方案,但大部分方案不是基于ROS1,就是需要在本地部署非常多的功能包,这使得语音控制方案的部署成本偏高,可能会遇到很多版本冲突问题,于是作者在查阅大量资料后,做出了这一版方案(作者只在pc端部署过,具体边缘设备部署可以参考本方案)。如果开发者有更好的更改方案,可以在评论区讨论。本方案是基于科大讯飞的语音流式听写做的一款方案,具体的语音输入、分析、输出等过程均在云端处理完成,这就极大减少了工作量,但是方案中也需要安装很多python包,具体配置见代码。
2025-07-22 18:32:52
444
原创 deepseek介绍及vscode部署
最近,国产AI大模型deepseek冲上热搜,引起了国内外的的广泛关注,也震惊了业内。具体的模型效果这里不谈,但它开源,比如说一句真香,本文具体谈一下deepseek的入门,并分析一下deepseek的优势。
2025-01-27 15:43:32
4580
原创 在RDK X5 上基于yolov8的魔方还原机器人
先讲一下我做这个项目的想法吧,这是我一年前自己从零开发的项目,整个项目是我和朋友两个人做的,我主要做的是嵌入式、下位机的一些东西,包括机器人的结构设计、光源布置、底层硬件选型、嵌入式的一些工作。整个系统的上位机全部是由我朋友写的,上位机主要是用python写的,主要是用opencv进行识别,其中也用到了一些仿射变换算法等。但是最终由于个人以及赛区原因,很遗憾最终没有进入国赛。为了弥补之前的遗憾,也为了恶补一下软件方面知识,刚好遇到了地瓜机器人的项目,所以我把整个项目重启了。
2024-11-15 20:53:09
2845
原创 pytorch安装详细教程
(GPT生成)PyTorch 是一个开源的深度学习框架,由 Facebook 的人工智能研究团队开发。它因其灵活性、易用性和高性能而受到广泛欢迎。:PyTorch 使用动态计算图(即定义即运行),这意味着计算图在每次运行时都是动态创建的。这使得调试和模型开发更加直观和灵活。:PyTorch 提供了一个强大的多维数组(张量)库,支持 GPU 加速。张量的操作与 NumPy 类似,但可以在 GPU 上高效运行。:PyTorch 提供了自动求导功能,简化了反向传播过程,用户只需关注模型的前向传播部分。
2024-10-21 15:33:10
3136
原创 RDK X5测评
总的来说,RDK studio的应用极大便利了用户的开发流程,目前发布的一些内置应用目前能够满足大部分的开发需求,对于管理开发板也有很大的帮助。我对于RDK studio中的摄像头拍照进行了简单测试,这里我仅仅只调用了摄像头,测试了node-red软件,该软件采用图像化编程,用户交互界面简洁方便,简单易懂,极大降低了使用难度以及趣味性。按照该项目的教程我顺利完成了相关配置以及编译工作,我简单在命令行体验了一下,进行了基础对话,基本能够正确回答我所问出的问题。下面我将对于这两个算法进行简单的说明。
2024-10-13 21:08:13
2806
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅