自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Reinforcement Learning for VLA(强化学习+VLA)

本文探讨了强化学习(RL)与视觉-语言-动作(VLA)模型结合的机器人操控系统。

2025-12-26 17:57:49 647

原创 星尘自研Lumo-1模型(mind to hand)详细解读

《Mind to Hand: 具身推理驱动的机器人控制框架》提出了一种创新性的机器人控制架构,通过离散动作分词器和强化学习实现了语义推理与精准操作的统一。

2025-12-19 15:32:25 748

原创 【记录】为ubuntu系统安装显卡驱动后掉网卡驱动

分析解决Ubuntu系统安装NVIDIA显卡驱动后可能出现网卡驱动丢失问题

2025-12-16 18:00:28 307

原创 uv 技术详解

uv是由Astral团队开发的下一代Python包与项目管理工具,基于Rust编写,具有极速性能(比pip快10-100倍)和统一工具链的特点。它整合了pip、venv、pip-tools等功能,通过全局缓存和硬链接技术大幅降低磁盘占用。相比传统工具链,uv采用现代化的PubGrub依赖解析算法,支持项目中心工作流和临时环境等创新特性。安装简单,提供uv init/sync/add/run等高效命令,特别适合Web开发、Docker构建和CI/CD场景,是提升Python开发效率的革命性工具。

2025-12-11 16:51:10 867

翻译 Kyle Vedder:Robot Learning现状

2025年机器人学习仍主要依赖行为克隆(BC)技术,通过模仿人类演示数据来训练策略。数据收集方式包括主从遥操、智能演示手套和直接人体演示,各有优缺点。当前面临的主要挑战是策略在分布外状态的表现不佳,需通过DAgger方法迭代优化。尽管强化学习(RL)在理论上更具潜力,但由于模拟与现实差距、反事实推理困难等问题,实际应用受限。未来预测显示,视频模型骨干网将取代VLA,世界模型可能成为关键突破。建议关注高效人工演示系统的开发,这是当前最可行的商业化方向。

2025-12-11 11:37:30 43

原创 OpenArm开源项目总结(移植lerobot框架)

本项目将开源机械臂OpenArm适配到LeRobot框架,实现了双臂遥操作和视觉语言动作(VLA)数据采集功能。

2025-12-11 11:17:10 1339

原创 大模型低秩微调技术 LoRA 深度解析与实践

探讨了参数高效微调(PEFT)技术中的LoRA方法,针对大模型微调面临的资源挑战,提出通过低秩矩阵分解实现高效适配

2025-06-06 11:28:47 1019

原创 大模型:从基座构建到应用落地--预训练与后训练及个人解析-2025.6

探讨大模型预训练与后训练(包括微调和各类应用策略)的原理、成本、技术挑战与优势,为读者构建一个尽量全面的技术图景,结合当前行业趋势,为读者提供一个参考。

2025-06-03 21:06:04 1970 1

原创 大模型的分词器——算法及示例

分词是自然语言处理的基础技术,将文本分割为离散单元(如单词、子词或字符)。主流方法包括词级、字符级和子词分词,其中子词分词(如BPE、WordPiece)通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表,WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题,提升了模型效率,广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求(单语言/多语言)和文本特性。

2025-06-03 15:30:59 1611

原创 从C:\到/:Windows用户极速通关Ubuntu Linux的航海万字指南

本篇博客从Windows的舒适区出发,以最直观、最易懂的方式——对比学习——深入探索Ubuntu Linux

2025-05-30 15:38:04 1552

原创 GraphRAG: 解锁大模型对叙述性私有数据的检索能力

微软最新开源的GraphRAG确实能补上传统RAG的短板,显著提升精确度。但是速度慢、成本高是当前最大问题。

2025-05-30 14:51:43 1022

原创 机器人学导论速览

帮助读者快速浏览机器人学导论内容。

2025-05-29 19:02:42 990

原创 Lerobot框架使用(含本地数据训练)

本文详细的介绍了使用lerobot框架在so-arm100机械臂上复现相关robot learning算法详细流程(含本地数据训练和错误排查)。

2025-05-29 17:39:21 2540 3

原创 强化学习入门笔记

智能体通过​​试错​​和​​奖励反馈​​不断优化决策策略,以追求​​最大化累积回报​​的方法-RL

2025-05-29 17:15:26 614

原创 Docker入门及基础使用

Docker 是一种开源的容器化技术,想象一下,你是一位厨师,你需要……

2024-09-12 23:26:17 1098

原创 Graph Structure Learning for Robust GNNs

关于图结构学习在增强图神经网络在对抗环境下的鲁棒性。提出了pro-GNN的新框架。

2024-09-12 16:55:09 1172

原创 计算机系统基础(图文版)

计算机组成基础内容

2024-09-11 22:52:56 2914

原创 联邦学习研究方向及论文推荐(二)

第二篇联邦学习论文推荐。

2024-07-23 22:44:22 3423

原创 联邦学习研究方向及论文推荐(一)

关于联邦学习的概念在网上资源丰富,但是考虑到有些同学在接触时缺少对研究方向细致了解而困恼,根据一些综述论文博客等资料为大家做个易于理解的详细介绍。由于内容较多且分为两部分。

2024-06-03 19:39:09 7651 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除