- 博客(5)
- 收藏
- 关注
原创 UCB CS285 模仿学习之行为克隆
给定一组由专家策略πE(策略未知)生成的示范数据(训练数据集)Dtrii1m,其中tris1a1s2a2sHaHsjajH模仿学习的目标是学习一个策略πθ,使其尽可能接近专家策略πE。基本流程:先获取专家数据(训练用),然后以ot作为输入,产生的动作at作为输出(标签),通过监督学习的方法进行训练目标:maxθEot∼pdataot。
2025-04-22 10:37:16
889
原创 机器人学中的姿态的表示方法
让我们想想,达成同一个变换的结果,比如把点11变到点23去,你可以有两种做法。第一,坐标系不动,点动,把11点挪到23去。第二,点不动,变坐标系,让 x 轴的度量(单位向量)变成原来的 1/2,让 y 轴的度量(单位向量)变成原先的 1/3,这样点还是那个点,可是点的坐标就变成23了。方式不同,结果一样。从第一个方式来看,那就是我在《理解矩阵》1/2 中说的,把矩阵看成是运动描述,矩阵与向量相乘就是使向量(点)运动的过程。在这个方式下,Mab的意思是:“向量a经过矩阵M。
2024-10-24 21:04:56
1338
原创 计算机保研/考研数据结构面试指南:核心知识点
对于一个二叉树来说,如果左子树的值都小于根节点的值,右子树的值都大于根节点的值,那么就称这个树为二叉搜索树;【答:在需要频繁进行插入/删除节点时,平衡二叉树需要进行大量的旋转以保证严格平衡,这部分开销很大,红黑树因为降低了对平衡的要求,更适合】个指针域,线索二叉树指的是利用这些空白的指针域,这些空白的指针域也被称作线索,存放的是某种遍历顺序下的该节点的前驱结点和后继结点】重复上面两步,直到所有顶点都输出,拓扑排序完成,或者图中不存在入度为零的点,此时说明图是有环图,拓扑排序无法完成,陷入死锁。
2024-09-25 00:53:15
1562
原创 矩阵求导基础与最小二乘法应用解析
本文讨论了矩阵求导和最小二乘法,强调了矩阵在多维数据处理中的重要性。介绍了矩阵求导的基本概念、符号规定及常用公式,并通过例子展示了标量与向量、向量与标量、向量与向量的求导方法。最后,应用矩阵求导推导了最小二乘法在线性回归中的损失函数及其最优参数的求解。
2024-09-22 20:17:14
615
1
原创 掌握YOLOv5:自定义数据集训练全流程指南
配置环境下载完整yolov5代码提供两种方式 GitHub官网:GitHub - ultralytics/yolov5: YOLOv5 ???? in PyTorch > ONNX > CoreML > TFLite百度网盘链接:链接:百度网盘 请输入提取码密码: d9db下载官方模型(这就是权重文件)GitHub官网:Releases · ultralytics/yolov5 · GitHub(往下翻)在yolov5-master下创建一个weights文件,
2021-11-06 11:24:35
13923
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅