- 博客(31)
- 收藏
- 关注
原创 高度图(Heightmap)
高度图(Heightmap)是一种基于规则网格的地形表示方法,其数学本质是将三维地形简化为二维离散函数,通过高度值的存储和插值实现地形重建。以下从数学建模角度系统阐述其组成原理及关键技术。离散化定义设连续地形为三维函数 z = f(x, y) ,将二维平面离散化为 N*M 的规则网格:G={(xi,yj,hij)}其中{xi=xmin+iΔx,i=0,1,...,N−1yj=ymin+jΔy,j=0,1,...,M−1hij=f(xi,yj)\mathcal{G} = \{ (x_i, y_j, h_
2025-04-17 10:01:26
889
原创 判断框架是否可收敛的方法
模型训练只在非常狭窄的学习率范围内才能收敛的情况。例如,只有当学习率严格限制在0.00045-0.00055之间时才能稳定训练,稍微偏离就会导致训练失败或发散。这种高敏感性通常表明算法不够稳健(robutness)。这两种情况都会导致参数数量剧增,可能引发训练困难、过拟合、梯度消失/爆炸等问题。不同随机种子重复训练多次。
2025-04-17 09:34:22
198
原创 动手写reward函数
此外,该函数在 ((\pm\sigma, 0.5)) 处具有驻点,简化了缩放系数 ( \sigma) 的调整。较大的 (\beta) 值会使函数更接近矩形函数,从而在 (x) 小于 (\sigma) 时施加较小的惩罚。例如,绕 Z 轴旋转 ψ,再绕 Y 轴旋转 θ,最后绕 X 轴旋转 ϕ,得到旋转矩阵:R=Rz(ψ)Ry(θ)Rx(ϕ)其中,每一列代表刚体坐标系的基向量(如 X、Y、Z 轴)在世界坐标系中的方向。绕固定轴(如 Z-Y-X)依次旋转三个角度(偏航角、俯仰角、横滚角)。
2025-04-15 17:59:54
994
原创 动手强化学习之马尔可夫决策(机器人篇)
马尔可夫决策过程(Markov Decision Process, MDP)是一种数学框架,用于建模智能体(agent)在随机环境中做决策的问题。它假设环境的状态转换具有,即未来的状态只依赖于当前状态和智能体采取的动作,而与过去的历史无关。MDP 是强化学习(Reinforcement Learning, RL)的基础模型,许多强化学习算法和理论都建立在 MDP 之上。
2025-04-14 22:46:25
427
原创 动手学习:路径规划原理及常用算法
路径规划(Path Planning)是机器人导航的核心任务,目标是为机器人找到一条从起点到终点的无碰撞路径,同时满足约束条件(如最短路径、最优能耗、安全性等)。在人形机器人场景中,路径规划需要考虑复杂环境(如障碍物、地形变化)和机器人自身的运动学约束(如步态、关节限制)。
2025-04-10 17:29:04
918
原创 CSC的主要学术成果摘要撰写
12 【CSC填表| 学术成果摘要如何写?- 暴躁的小米粥 | 小红书 - 你的生活指南】 😆 zNSjEcao3LwnsYI 😆 https://www.xiaohongshu.com/discovery/item/679e5cf5000000001801083e?
2025-03-13 00:34:46
620
原创 CSC申请表格填写的排版问题
—69 【CSC系统填报指南 4️⃣ 研修计划-2 - 努力毕业的小黄 | 小红书 - 你的生活指南】 😆 OnaDGAAQZoAr27b 😆 https://www.xiaohongshu.com/discovery/item/659507e6000000001102f8c4?1️⃣ 字数3000字以内,这部分需要仔细斟酌,反复修改,真的非常重要!一定要好好逐句修改!2️⃣ 和英文PR不同,这部分不需要写参考文献,文中的英文尽可能用中文代替,节省字数。5️⃣ 告诉评审老师我很优秀,外导能力很强!
2025-03-11 21:37:08
872
原创 CSC 网上填写内容遇到问题总结与分析
总的来说:核查自己是否符合申报条件;申请表中填写的姓名的汉字及拼音、身份证号、出生年月日等基本信息是否准确、留学单位、留学期限等信息与邀请信内容是否一致;申报及上传材料是否齐全、真实有效且符合要求。
2025-03-11 00:47:24
873
原创 一个好的研修计划(CSC申请)是怎样的?
简明扼要,用2-3句话概括课题所在领域的基本情况,避免赘述。例如,如果是人形机器人强化学习,可以提及其在智能机器人领域的核心地位及其近年来因AI技术进步而受到的广泛关注。
2025-03-10 10:34:12
351
原创 2025 CSC 申请(重庆)
以下是我在重庆市教育局查找的消息2025年国家留学基金资助出国留学材料提交时间及应提交的材料清单国家建设高水平大学公派研究生项目3月10日0时—4月1日14时3月28日1.机关、事业单位、国企工作人员及在校学生需提供单位正式公文,私企工作人员需提供申报截止日期前3个月社会保险参保证明且缴存状态正常;2.推荐人选名单一览表;3单位推荐意见表(相关项目全部勾选填写后加盖推荐单位公章,放在申请人提交的纸质申请材料第一页);4。
2025-03-07 16:51:52
567
原创 CSC研修计划的书写-续1
from :【2024年CSC联培博士申请—研修计划中文 - 水博士日常 | 小红书 - 你的生活指南】 😆 aQ8md1UbskKWpaw 😆 https://www.xiaohongshu.com/discovery/item/6606cadc000000001a014d5d?
2025-03-01 22:48:35
202
原创 机器人学顶会总结
开始准备时间:会议前一年(通常为前一年的10月或11月左右开始)。开始准备时间:会议前一年(通常为前一年的10月或11月左右开始)。开始准备时间:会议前一年(通常为前一年的5月或6月左右开始)。开始准备时间:会议前一年(通常为前一年的6月或7月左右开始)。投递时间:会议前6-8个月(大致为2月至4月)。会议举行时间:10月或11月。会议举行时间:10月或11月。会议举行时间:5月或6月。会议举行时间:6月或7月。投递时间:9月或10月。
2025-03-01 22:39:29
164
原创 卡尔曼滤波的Matlab
链接:https://pan.baidu.com/s/1PgZanfit7aZFSxScKtSK3g。【超级会员V3】通过百度网盘分享的文件:卡尔曼应用模型1...复制这段内容打开「百度网盘APP 即可获取」需要的友友自提,百度网盘,免费的。
2025-02-19 11:07:17
424
原创 世界模型 World Model
最近在思考到底什么是world model,然后可以写一下和大家探讨一下啊deepseek的说法世界模型(World Model)是人工智能中用于模拟外部环境动态的认知系统,其核心功能是构建对世界的内部表征(理解当前状态)和预测未来状态变化(推理与规划)。
2025-02-17 18:41:25
764
原创 VLA模型
在机器人领域,视觉-语言-动作 (VLA) 模型的发展经历了显著的演变,这得益于计算机视觉和自然语言处理领域的进步。VLA 模型代表了一类旨在处理多模态输入的模型,整合了来自视觉、语言和动作的信息。这些模型对于实现具身智能至关重要,使机器人能够理解物理世界并与之互动。早期阶段: 计算机视觉和自然语言处理的集成大约在 2015 年开始,随着视觉问答 (VQA) 系统的出现。这些系统可以回答关于图像的问题,标志着结合视觉和语言理解的早期步骤。VLM 的进步: Transformer 架构以及和。
2025-02-17 13:01:44
897
原创 3D diffusion Policy
将扩散模型引入机器人控制策略,利用其强大的生成能力,从三维感知输入(如点云、深度图)中直接生成连续动作序列。3D扩展:结合点云扩散(如。
2025-02-17 12:27:19
826
原创 面试Coding准备
因此,唯一可能的组合是形如6k+1, 6k+2, 6k+3或者 6k+5, 6k+6, 6k+7的序列中,其中 6k+1和 6k+5可能是质数,而中间的那个数 6k+2或 6k+6 必须被2或3整除,但考虑到我们讨论的是大于6的连续整数,且已知其中两个是质数,所以实际上只有 6k+6符合条件,因为它不仅被2整除也被3整除,即它是6的倍数。是一种遍历或搜索树或图的算法。首先,我们知道任何整数都可以表示为 6k, 6k+1, 6k+2, 6k+3, 6k+4, 或 6k+5的形式,其中 k 是某个整数。
2025-02-17 12:17:12
604
原创 两轮车与DQN
DQN(Deep Q-Network)算法是深度强化学习的一个重要突破。它结合了Q-learning和深度神经网络,用于解决具有连续状态空间的决策问题。工作原理:神经网络输入是环境状态,输出是每个可能动作的Q值(期望收益)想象你在玩一个游戏,站在一个路口(这是当前状态),需要决定往哪个方向走(这是可能的动作)。每个方向最终都能让你获得不同的分数(这是奖励)。Q值就是用来预测:"如果在这个状态下采取这个动作,最终能获得多少总分数。
2025-02-17 01:53:56
536
原创 四足机器人与RL
并通过以下方式给予奖励:Refficiency=λefficiency×di 其中,λ_efficiency是步态效率的加权系数。机器人每走一段距离,便获得正奖励,奖励越高表明机器人走得更有效率。
2025-02-16 21:46:19
744
原创 VLM与行为树
4. OFA (Unified Model for Vision and Language): OFA 是一个统一的视觉-语言模型,能够处理多种多模态任务,如图像描述、视觉问答和文本生成。这些模型在公开的评测基准(如 COCO、VQA、Flickr30k 等)上都有详细的排名和性能比较。6. SimVLM (Google): SimVLM 是一个简单的视觉-语言模型,通过大规模预训练在多个视觉-语言任务中取得了优异的表现。,能够生成高质量的图像描述,并在视觉问答任务中表现出色。它在多个评测基准上排名靠前。
2025-02-16 20:54:32
957
原创 灵巧手与神经科学
物体旋转任务分解为在物体表面上的指尖动作模式,指代是在物体已经被抓取后,机器人通过细微的手指动作(如旋转、调整位置等)来操控物体的过程。这类操作通常依赖于(如力反馈),而不像视觉反馈那样直接参与,因为这些任务需要快速的循环运动和小幅度的手指位移。技能序列化尤其是当环境光照变化时,模型表现会下降。手套式和基于视觉的方式。
2025-02-16 20:07:58
541
原创 面试知识准备
深度学习是机器学习的一个子领域,它使用多层的神经网络来自动从数据中提取特征并进行决策或预测。深度学习的核心优势在于,它能自动从原始数据中学习特征,无需手动设计特征工程。例如,在图像分类任务中,深度学习通过卷积神经网络(CNN)能够自动从图像中提取层次化特征,从而避免了传统机器学习中需要手动提取和选择特征的过程。相比之下,传统机器学习方法通常依赖于人工特征提取,并且在复杂任务中可能不如深度学习表现好。
2025-02-16 18:19:37
727
原创 Behavior Tree
行为树(Behavior Tree, BT)是一种用于描述和控制人工智能(AI)系统中智能体行为的工具。它是一种层次化的结构,用来以树形图的形式表达决策过程,特别是在游戏开发和机器人控制中。行为树通过组织一系列任务和行为节点,帮助AI系统根据不同的条件做出决策,并通过这些节点来控制智能体的行为。
2025-02-16 16:31:20
242
原创 禾赛嵌入式工程师面试
通过GPIO检测按键的按下和释放。使用定时器计算按键按下的时间。根据按键按下的时间和是否同时按下,判定按键是短按、长按还是同时按下。这种设计非常适合STM32的硬件架构,因为STM32有足够的定时器和GPIO支持,可以灵活实现按键输入的各种逻辑。2 从驱动层面上IIC, SPI ,CAN的区别。
2025-02-13 13:39:38
1037
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人