
人工智能技术
文章平均质量分 67
人工智能相关的理论基础和实际应用
具身小站
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
扩展卡尔曼滤波(EKF)的一阶泰勒展开(雅可比矩阵)详解
概念雅可比矩阵(Jacobian Matrix)是向量值函数的一阶偏导数构成的矩阵。对于一个从RnR^nRn映射到RmR^mRm核心原理雅可比矩阵的本质是提供多变量函数在某一点的最佳线性近似,对于函数 F(x) ,在点 a 附近的线性近似为:作用与效果雅可比矩阵描述了输入空间的小变化如何映射到输出空间,表示了在局部区域内,函数如何"拉伸"、"旋转"和"扭曲"空间,雅可比行列式(矩阵的行列式)表示了局部体积的变化率和方向,即雅可比矩阵的每个元素∂Fi∂xj∂xj。原创 2025-08-20 18:23:54 · 528 阅读 · 0 评论 -
进一步理解扩展卡尔曼滤波EKF
EKF 是对 KF 的扩展,使其能够处理非线性系统,它通过一阶泰勒展开(雅可比矩阵) 在当前估计点附近对非线性函数进行局部线性化,然后应用标准 KF 的预测和更新框架。为非线性系统的状态估计提供了一个相对高效的框架,但线性化误差导致其是次优的,且计算雅可比矩阵可能很繁琐,对高度非线性系统效果不佳(为此后来出现了无迹卡尔曼滤波UKF等更先进的算法)。原创 2025-08-20 10:39:41 · 665 阅读 · 0 评论 -
Python从零基于词向量实现词语相似度计算
gensim是一个专注于无监督主题建模和自然语言处理的Python库,由Radim于2009年创建,专为处理大规模文本数据集而设计,具有内存效率高、可扩展性强的特点。核心优势内存友好:能够处理超出RAM大小的语料库并行处理:支持多核CPU加速工业级:在生产环境中广泛应用算法丰富:包含多种主题模型和词向量算法API简洁:易于使用的接口设计应用场景文本相似度计算语义搜索文档聚类主题建模词向量训练与应用文本摘要生成推荐系统模块结构模块功能。原创 2025-08-19 09:06:26 · 528 阅读 · 0 评论 -
Python从零实现文本特征提取
sklearn.feature_extraction.text 是 scikit-learn 库中专门用于文本特征提取的核心模块,它提供了一系列工具将原始文本数据转换为机器学习算法可以处理的数值特征向量。这个转换过程通常称为向量化(Vectorization)或特征提取(Feature Extraction)。核心功能文本预处理:清理、标准化文本分词(Tokenization):将文本拆分为词语或n-gram词汇表构建:创建词项到特征索引的映射。原创 2025-08-18 13:49:10 · 793 阅读 · 0 评论 -
Python实现网页文本清洗
Python的re模块(regular expression的缩写)是Python内置的正则表达式处理库,它主要用于字符串的匹配、搜索、替换和分割等操作,是处理文本数据的强有力工具。这对于正则表达式至关重要,因为正则中大量使用反斜杠表示特殊含义(如\d表示数字),如果不使用原始字符串,就需要写成"\d",这不仅难以阅读,还容易出错。这个r表示"原始字符串"(raw string)。它的核心作用是:让反斜杠\被视为普通字符,而不是转义字符。原始字符串r"\n"则表示包含反斜杠\和字母n的两个字符。原创 2025-08-18 13:48:35 · 980 阅读 · 0 评论 -
从零开始使用jupyter虚拟环境
Anaconda默认安装了jupyter notebook,直接启动即可。原创 2025-08-17 12:16:33 · 291 阅读 · 0 评论 -
从零开始理解了卡尔曼滤波
通过这个基础框架,你可以扩展更复杂的模型(如加入加速度、多传感器融合等)。对于匀速运动的小车:(纯基于物理模型,没有考虑实际测量值,模型越准确,预测越可靠)Kₖ:卡尔曼增益(平衡预测值和测量值,决定信任预测还是测量)F:状态转移矩阵(描述状态如何变化,如位置+速度×时间)(zₖ - H x̂ₖ⁻):测量残差(预测与测量的差异)x̂ₖ⁻:当前时刻的预测状态(如预测的位置/速度)Pₖ:更新后的不确定性(比预测时更小)Pₖ⁻:预测状态的不确定性(协方差)H:观测矩阵(状态如何转换为测量值)原创 2025-08-08 09:39:57 · 789 阅读 · 0 评论 -
指定起始目标位姿实现自主导航
可以直接在launch文件中,通过amcl配置起始位姿。原创 2025-07-22 08:58:07 · 262 阅读 · 0 评论 -
在 TurtleBot3 上实现同步建图与导航(在线 SLAM)
修改navigation.launch文件(或创建一个新的融合launch文件),使其同时启动gmapping和move_base,并确保地图服务器使用gmapping实时发布的地图。通过同时运行gmapping(建图)和move_base(导航)来实现,但需要注意两者之间的协调,特别是地图的更新和共享。修改gmapping_demo.launch文件,使其发布的地图话题与导航使用的地图话题一致,并调整参数以适应动态地图。注意:在导航中使用动态地图时,需要配置move_base以订阅实时更新的地图。原创 2025-07-22 08:57:23 · 965 阅读 · 0 评论 -
ROS1和ROS2详细对比分析
从Ubuntu22.04或者2025年6月开始,官方基本不再升级支持ROS1,推荐切换到ROS2,ROS 2 在架构、实时性、安全性和生态扩展性上显著优于 ROS 1,如果是新项目开发建议直接使用ROS2,但如果迁移需权衡现有资源与长期收益。详细Ubuntu版本支持关系见链接。原创 2025-07-21 18:11:23 · 1322 阅读 · 0 评论 -
从零开始完成ROS2项目调试运行
VSCode 集成 :安装 ROS 2 插件后,可通过快捷命令(如 rl-colcon-build)直接在 VSCode 中编译项目。命令行补全 :安装 ros2cli 后,支持命令自动补全(如输入 ros2 launch 自动列出包名和 Launch 文件)。类似发布代码一样,编写监听代码(sub_node.py),配置setup.py后,重新编译包,最后启动测试。调试 :结合 ros2 node、ros2 topic、ros2 param 等工具实时监控系统状态。原创 2025-07-17 14:32:56 · 785 阅读 · 0 评论 -
ROS2中分布式通信原理详解
ROS2 的通信原理基于采用分布式架构的 DDS(Data Distribution Service) 中间件,是一种以数据为中心的发布-订阅模型,其核心原理是节点之间通过实现分布式通信,进行数据交换,无需中心节点(ROS1 的 Master)。原创 2025-07-17 14:32:13 · 811 阅读 · 0 评论 -
一键执行自主导航仿真
【代码】一键执行自主导航仿真。原创 2025-07-12 10:19:43 · 285 阅读 · 0 评论 -
从零开始使用global_planner全局规划
表示从障碍物向外扩展的“安全区域”范围(单位:米,表示用于计算的区域,区域外默认安全则不计算),在这个区域内,代价值会根据 cost_scaling_factor 计算,路径规划器会尽量避开高代价区域。turtlebot3_navigation.launch文件中,move_base_globalplanner.launch代替初始move_base.launch。是膨胀代价的衰减因子 ,控制代价值从障碍物向外递减的速度,数值越大代价衰减越快,数值越小代价衰减越慢路径可能更贴近障碍物。原创 2025-07-11 15:56:59 · 918 阅读 · 0 评论 -
slam全局路径规划算法详解(Dijkstra、A*)
核心思想 :贪心策略,始终选择当前状态下距离起点最近的顶点作为扩展方向,并更新其相邻顶点的最短路径。核心思想 :结合Dijkstra的全局代价g(n) 和启发式函数h(n) ,综合评估节点优先级。地图描述 :10x10网格,起点为左下角(0,0),终点为右上角(9,9),障碍物随机分布。A* 通过启发式优化大幅提高效率,但依赖 h(n) 的设计,适用于大规模地图的高效寻路。h(n) :当前节点到目标的启发式估计代价(如欧几里得距离)。g(n) :起点到当前节点的实际代价;确保找到全局最优解(最短路径)。原创 2025-07-11 15:56:32 · 992 阅读 · 0 评论 -
gazebo中多个机器人在rviz上同时构建局部地图
使用slam_gmapping代替static_transform_publisher,通过动态发布tb3/map->tb3/odom的tf变换,实现各机器人局部地图构建。原创 2025-06-24 11:09:56 · 519 阅读 · 0 评论 -
路径规划器(局部dwa_local_planner、全局NavfnROS)
move_base节点调用两个规划器,NavfnROS全局规划器负责生成从起点到目标点的宏观路径(如 /move_base/NavfnROS/plan),dwa_local_planner 则跟踪该路径并实时调整局部轨迹(如 /move_base/DWAPlannerROS/local_plan)原创 2025-06-24 11:08:52 · 1118 阅读 · 0 评论 -
从零部署实现Cartographer算法建图
【代码】实现Cartographer算法建图。原创 2025-06-19 10:03:01 · 759 阅读 · 0 评论 -
ROS的tf_tree中的节点含义详解
rosnode(如robot_state_publisher)↓ 发布TF数据到rostopic(如/tf, /tf_static)↓ 通过TF库传输rqt_tf_tree(可视化坐标系节点和变换边)原创 2025-06-13 12:57:29 · 740 阅读 · 0 评论 -
机器人ROS系统各坐标系含义、关系与作用
含义:全局固定坐标系,作为其他所有坐标系的参考基准。通常作为最高层级的父坐标系,与机器人所在的环境地图对齐。作用:提供绝对的位置参考,用于全局路径规划和导航。原创 2025-06-12 08:34:31 · 1044 阅读 · 0 评论 -
智能机器人从零构建陪跑计划
本人背景技术履历陪跑内容:近期计划:拒绝“收藏吃灰”:全流程陪跑:节奏:所有问题闭环:资料增值:原创 2025-06-11 10:55:27 · 1106 阅读 · 0 评论 -
gazebo同一个场景中加载多个机器人
在launch文件中,使用不同命名空间区分不同机器人。原创 2025-06-11 09:34:26 · 432 阅读 · 0 评论 -
从零基于Gazebo实现仿真车辆模型构建
二、从零构建双轮差速机器人步骤1:创建URDF模型编写基础底盘URDF创建文件 ~/catkin_ws/src/my_robot/urdf/diff_robot.urdf.xacro:xml底盘长宽高左轮厚度与半径右轮(复制左轮并调整位置)Y轴偏移,90度旋转绕Y轴旋转右轮定义类似,偏移改为 xyz="0 -0.15 0"关键点:差速轮需设置 type=“continuous” 关节10惯性参数()必须定义,否则Gazebo物理引擎报错添加差速控制器插件。原创 2025-06-09 17:46:23 · 483 阅读 · 0 评论 -
基于TurtleBot3在Gazebo地图实现机器人远程控制
【代码】基于TurtleBot3在自建Gazebo地图实现机器人远程控制。原创 2025-06-09 14:07:57 · 494 阅读 · 0 评论 -
从零开始基于Ubuntu 20搭建Gazebo地图仿真环境
虚拟机及系统的共享盘地址:【https://pan.baidu.com/s/1DxUpom3lj0xkr5_CwqdEVA?pwd=h7ta】原创 2025-06-06 14:16:33 · 502 阅读 · 0 评论 -
无人车导航文档整理目录
原创 2025-06-06 10:12:49 · 136 阅读 · 0 评论 -
lekiwi语音控制车辆运动演示步骤
【代码】lekiwi语音控制车辆运动演示步骤。原创 2025-06-04 10:20:32 · 227 阅读 · 0 评论 -
lekiwi-lerobot仅双臂时,主从同步演示步骤
启动后,即可操控主臂遥控从臂。原创 2025-06-03 15:28:31 · 289 阅读 · 0 评论 -
lerobot开源机械臂10次训练记录
【代码】lerobot开源机械臂10次训练记录。原创 2025-05-30 10:27:51 · 366 阅读 · 0 评论 -
lerobot机械臂的标定、遥控、数据录制、训练、源码解读
lerobot开源机械臂的从零开始标定、遥控、数据录制、训练、源码解读原创 2025-05-29 11:45:57 · 1069 阅读 · 0 评论 -
从零实现离线多语言识别(SenseVoice模型)
SenseVoice 是具有多语言音频理解模型,支持语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)、逆文本正则化等能力。采用工业级数十万小时的标注音频进行模型训练,保证了模型的通用识别效果。模型可以被应用于中文、粤语、英语、日语、韩语音频识别,并输出带有情感和事件的富文本转写结果。多语言识别: 采用超过40万小时数据训练,支持超过50种语言,识别效果上优于Whisper模型。原创 2025-05-29 10:03:18 · 950 阅读 · 0 评论 -
FunAsr默认语音识别模型体验对比(Paraformer)
Paraformer模型结构如上图所示,由 Encoder、Predictor、Sampler、Decoder 与 Loss function 五部分组成。Paraformer是达摩院语音团队提出的一种高效的非自回归端到端语音识别框架,项目为Paraformer中文通用语音识别模型,采用工业级数万小时的标注音频进行模型训练,保证了模型的通用识别效果。模型可以被应用于语音输入法、语音导航、智能会议纪要等场景。原创 2025-05-27 10:25:13 · 1619 阅读 · 0 评论 -
从零实现本地语音识别(FunASR)
FunASR 是达摩院开源的综合性语音处理工具包,提供语音识别(ASR)、语音活动检测(VAD)、标点恢复(PUNC)等全流程功能,支持多种主流模型(如 Paraformer、Whisper、SenseVoice)的推理、微调和部署。原创 2025-05-27 09:20:18 · 1848 阅读 · 0 评论 -
语音控制设备的仿真/语音调试
【代码】语音控制设备的仿真/语音调试。原创 2025-05-22 14:58:41 · 353 阅读 · 0 评论 -
websocket协议及通信示例
【代码】websocket协议及通信示例。原创 2025-05-21 10:00:19 · 244 阅读 · 0 评论 -
语音对话工作流程说明
对话机器人,按照下面在设备端部署模型的方式实现,只需要具备基本的语音滤波处理及功放播放即可,那么设备的配置要求就低了。原创 2025-05-21 09:59:49 · 356 阅读 · 0 评论 -
智能机器人实战陪跑计划
从零开始搭建智能机器人,对爱好者及学生进行陪跑原创 2025-05-14 15:09:25 · 1596 阅读 · 0 评论 -
Python离线语音合成TTS模块示例(pyttsx3)
离线可用,但确实相对简单,单调,源码及生成的wav文件:【原创 2025-05-13 10:15:43 · 371 阅读 · 0 评论 -
小智AI客户端使用测试(Python)
【代码】小智AI客户端使用测试(Python)原创 2025-05-12 17:08:39 · 615 阅读 · 0 评论 -
Python文字转语音TTS库示例(edge-tts)
开源库,使用websocket跟微软在线模型。原创 2025-05-12 12:08:44 · 1225 阅读 · 0 评论