古月居GYH-优快云博客

原创 AI时代已来，机器人时代还会远吗？

【摘要】DeepSeek-R1的爆火引发业界关注，其核心技术DeepSeek-v2采用创新的MOE（混合专家）架构，通过将单一密集模型拆分为多个稀疏专家模型，显著降低激活参数量和硬件成本。相比传统Dense架构，MOE在保持性能的同时提升了性价比。DeepSeek还面临负载均衡等工程挑战，其前瞻性选择MOE路线部分源于国内硬件资源限制。此外，MLA技术的应用进一步优化了模型性能，这些创新使DeepSeek在价格和效果上具备竞争优势。

2025-08-06 10:00:00 520

原创从零开始训练YOLOv11

本文介绍了在AutoDL平台上训练YOLOv11模型的完整流程。首先建议在AutoDL上租用无卡模式进行初期配置（0.1元/小时），待准备就绪后再启用GPU训练。详细说明了使用Labelimg标注数据的方法，包括快捷键操作和XML文件生成要点。重点讲解了数据集的制作规范：需要创建标准文件夹结构（Annotations、ImageSets、JPEGImages、labels），统一图片格式，并提供将XML转为txt文件的处理方法。最后将整理好的数据集压缩上传至AutoDL平台解压使用。整个过程涵盖了从环境配置

2025-08-05 10:00:00 317

原创从High-level的人类指令中获得Human-Object_Interaction

斯坦福大学研究人员提出了一种新颖的系统，能够将高级人类指令（如"整理工作区"）转化为精确的人-物交互动作。该系统采用多阶段处理框架：首先通过大型语言模型解析指令并构建场景图，然后利用扩散模型和强化学习生成包括全身运动和精细手指动作的完整执行序列。系统包含四个关键模块：粗略动作生成、抓握姿态生成、动作细化和手指运动控制，实现了从高级语义到物理动作的自然映射。

2025-08-04 10:00:00 484

原创漫谈PID，聊聊实现与调参原理

PID控制器是工业控制中常用的算法，通过比例、积分、微分三个环节的线性组合构成控制量。比例系数KP调节当前误差，积分系数KI消除稳态误差，微分系数KD改善动态性能。控制器需从连续时间表达式离散化为差分方程（1）式实现编程计算，其中T为运算周期。KP、KI、KD之间存在固定换算关系，需注意积分时间Ti和微分时间Td与系数的倒数关系。实际应用中，运算周期T也是重要调节参数，最终可将各系数乘积直接写入代码以优化运算效率。

2025-08-03 10:00:00 867

原创 DemoStart：让机器人手学会复杂操作的神奇技术

研究人员提出DemoStart方法，通过整合示范操作与自动课程学习，解决多指机器人手复杂操控的sim-to-real难题。该方法创新性地将示范状态转化为梯度任务参数，采用零方差过滤筛选有效训练样本，并规避示范中的异常状态。实验表明，DemoStart能利用少量示范和稀疏奖励，在RGB视觉输入下实现高难度操作技能迁移，相比传统方法显著提升了学习效率和策略质量。该技术为复杂机器人系统的技能学习提供了新思路。

2025-08-02 10:00:00 612

原创归一化不存在了

深度学习中常用的归一化方法如批量归一化(BN)和层归一化(LN)各有适用场景，但随着任务多样化和模型复杂化，研究者提出了更多归一化变体。实例归一化(IN)在图像风格迁移等任务中表现突出，而群归一化(GN)则在小批量条件下表现优异。最新研究甚至质疑归一化层是否必须，探索去归一化模型的潜力。不同归一化方法在统计稳定性、适用场景和训练效率之间寻求平衡，需要根据具体任务选择合适方案。

2025-08-01 10:00:00 853

原创 Motion Tracks能实现跨载体吗？

清华大学团队在ICRA2024提出MotionTracks方法，解决机器人小样本模仿学习难题。传统模仿学习依赖大量人工演示，而MotionTracks通过构建跨体动作空间，将人类视频动作转化为机器人可执行指令，仅需少量演示即可实现技能迁移。这种统一表示方法突破了人类与机器人动作差异的障碍，使机器人能利用丰富的人类视频资源学习新技能，显著提升学习效率。该研究为机器人快速获取人类技能提供了创新解决方案。

2025-07-31 10:00:00 802

原创从零开始：使用URDF和RVIZ2构建并可视化机器人模型

本文介绍了机器人建模的URDF（统一机器人描述格式）标准。URDF采用XML格式，通过Link和Joint两种核心组件描述机器人结构：Link表示刚性部件，包含几何形状和质量信息；Joint定义部件间的连接方式，支持旋转、平移等运动类型。文章详细说明了Link的origin、material等属性设置，以及Joint如何关联父子部件并定义相对运动参数。URDF通过这两种组件的层级关系，能够完整描述机器人的物理结构和运动特性。

2025-07-30 10:00:00 1581

原创【LLM架构】动手实现MoE架构

本文介绍了MoE架构的核心原理与实现方法。MoE通过将传统Transformer的FFN层替换为多个稀疏专家层(SparseMoElayers)，并引入门控网络实现token分发。文章详细阐述了专家模型作为多层感知机(MLP)的实现方式，重点分析了PyTorch中nn.Sequential的使用方法及其限制条件。nn.Sequential可顺序组合标准层、自定义层和嵌套容器，但不支持动态结构、跳跃连接等复杂交互。

2025-07-29 10:00:00 805

原创带你手搓ROS应用之传统PLC系统集成

本文探讨了ROS2与传统PLC系统的集成方法，以解决工业4.0背景下工业自动化系统的实时数据交换与控制问题。文章介绍了ROS2的实时性优势和PLC系统的基本概念，重点阐述了通过Modbus协议实现两者通信的机制。文章详细描述了数据采集、处理、控制指令生成和反馈的关键流程，并提供了通信模型公式。系统部署建议使用Ubuntu 20.04和ROS2 Foxy版本，支持Modbus协议的PLC设备。该集成方案具有实时性强、扩展性好的特点，能够满足复杂工业自动化系统的需求。

2025-07-28 10:00:00 771

原创墙材码垛机器人目标检测

针对墙体砖块检测中的技术难题，包括砖块堆叠紧密、光线反射差异及灰尘干扰等问题，本文提出基于YOLOv8的改进方案。主要改进包括：采用WBiFPN结构增强多尺度特征融合能力，引入SPPF机制扩展感受野，增加小目标检测头提升检测精度。数据集包含混凝土砖和红砖两类，使用LabelImg标注并采用标准YOLO格式组织。网络结构优化方面，通过BIFPN实现双向特征融合，结合CBAM注意力机制增强对小目标的检测能力，提高模型在复杂环境下的鲁棒性。该方案有效解决了实际应用中的砖块检测难题。

2025-07-27 10:00:00 1011

原创在C++中使用Python库的详细指南

本文探讨在C++项目中集成Python库的方法，重点介绍了Boost.Python和Cython工具。通过对比两种语言的优势：C++的高性能特性适用于系统编程和游戏开发，而Python的丰富库资源在数据科学和AI领域更具优势。文章详细说明了环境配置步骤，包括安装C++编译器、Python库及依赖工具，并提供了使用Boost.Python创建模块、暴露C++类及处理错误的实践示例。这种跨语言开发方式既能发挥C++的性能优势，又能利用Python的生态系统，提高开发效率。

2025-07-26 10:00:00 669

原创 Xacro机器人建模指南：从基础定义到Gazebo仿真实战

Xacro是URDF文件的进阶版本，用于简化和优化机器人描述文件。它通过封装可复用部件和参数化设计，避免重复编写相似结构的代码。Xacro文件包含命名空间声明、宏定义、参数设置、条件语句等功能，支持动态生成不同配置的机器人模型。用户可调用ROS工具将Xacro转换为URDF文件，并利用gazebo标签配置仿真参数。这种方法提高了机器人建模的效率和灵活性，适用于多机器人系统开发。

2025-07-25 10:00:00 319

原创 RoboRefer：让机器人理解空间位置关系

北大与北航合作开发RoboRefer技术，解决机器人理解三维空间关系的难题。该研究针对现有视觉语言模型在复杂空间指称任务中的不足，提出创新解决方案：专用深度编码器避免模态干扰，强化学习微调实现多步推理，并设计新的数据集和评估基准。研究成果使机器人能更精准理解"将物体放在笔筒和键盘之间"等含复杂空间关系的指令，推动具身智能发展。

2025-07-24 10:00:00 858

原创 PID算法：从百年历史到智能控制，揭秘工业自动化的核心密码

PID算法：工业控制的核心密码 PID算法是一种历史悠久、应用广泛的闭环控制算法，通过比例（P）、积分（I）、微分（D）三个参数的协同作用，实现对系统的精确调节。P用于快速响应当前误差，D抑制系统振荡，I消除稳态误差，三者结合可优化控制性能。在平衡车、温度控制、定速巡航等场景中，PID算法能有效提高稳定性。参数Kp、Ki、Kd需合理调节：Kp决定响应速度，Ki消除累积误差，Kd抑制超调。例如，水温控制中，仅用开关量会导致剧烈波动，而PID算法能实现平滑调节。该算法在工业自动化领域具有不可替代的作用。

2025-07-23 10:00:00 830

原创宇树机器狗go2 gazebo仿真环境

本文介绍了在Ubuntu20.04系统下搭建宇树机器狗GO2的Gazebo仿真环境的方法。针对ROS1 Noetic版本，详细说明了ROS安装步骤（包括版本选择、桌面版安装）及安装验证方法。特别强调了必须安装特定依赖项，否则可能导致编译问题或腿部控制失效。作者通过两台不同电脑验证了该方法的可行性，并提供了相关图片说明。本文填补了网络上关于GO2机器人Gazebo仿真环境搭建教程的空白。

2025-07-22 10:00:39 357

原创机器人执行时出问题怎么办？看看英伟达研究院和斯坦佛怎么解决

针对模仿学习训练的机器人在分布外场景易失效的问题，斯坦福和英伟达提出Sentinel框架。该方案采用双模检测机制：通过统计时间动作一致性(STAC)分析动作分布稳定性来识别不稳定故障；利用视觉语言模型(VLMs)评估任务视频进度检测停滞故障。STAC计算累积统计距离捕捉异常动作，VLMs通过定制提示模板进行视频问答判断任务可行性。实验表明，这种互补检测方式显著提高了故障识别准确率，为生成式策略提供了可靠的运行时安全保障。

2025-07-21 10:00:00 560

原创 jetson orin nano super AI模型部署之路（二）保姆级最好用AI环境配置

本文介绍了在Jetson Orin Nano Super上配置AI Docker环境的详细步骤。针对ARM架构和JetPack 6.2版本兼容性问题，作者推荐使用jetson-containers工具预构建的镜像（包含PyTorch和TensorRT等组件）。配置过程包括：验证JetPack版本、安装jetson-containers工具、修改Docker默认运行时为NVIDIA，以及可选的重定位Docker数据目录（适用于存储空间不足的情况）。这些步骤为AI模型部署提供了优化的环境配置方案。

2025-07-20 10:00:00 421

原创 jetson orin nano super AI模型部署之路（一）deepseek r1模型部署

文章介绍了在Jetson Orin Nano Super 8GB设备上部署DeepSeek R1 AI模型的过程。该设备采用Ampere架构，具有67TOPS(INT8)算力和6核ARM Cortex-A78AE处理器，适合边缘计算任务。部署使用开源框架OLLAMA，支持一键部署多个模型。文章还探讨了如何配置Web界面以改善使用体验，以及Linux环境下11434端口的环境配置方法。

2025-07-19 10:00:00 334

原创【SCI-Idea】从零开始构建NLP中的对比学习

本文探讨了对比学习在NLP领域的应用，特别是针对EDA术语处理的监督对比学习方法。通过构建由锚点文本、正样本和硬负样本组成的三元组数据集，该方法在特征空间中优化文本表示，使相似语义文本彼此靠近。文章详细介绍了基于DeBERTa-v3的模型架构，包括LoRA微调和DeepSpeed加速技术，并提供了完整的代码实现（GitHub可获取）。核心创新点是根据EDA术语相似性而非句子结构来定义正负样本，通过温度调节的余弦相似度损失函数进行优化。

2025-07-18 10:00:00 670

原创 ROS应用 | 使用 Kalman Filter 进行传感器数据融合

本文介绍了KalmanFilter在传感器数据融合中的应用，重点讨论了其在机器人、自动驾驶等领域的重要性。KalmanFilter通过线性动态系统的最优递归滤波算法，结合预测和更新阶段，消除噪声并最小化估计误差。文章概述了其基本原理和公式，并提供了一个Python实现环境（NumPy、Matplotlib、SciPy），用于模拟2D系统中加速度计和GPS数据的融合。该技术能有效提升状态估计的准确性。

2025-07-17 10:00:00 416

原创 RangeNet++如何重新定义3D点云解析？

RangeNet++解决了LiDAR语义分割中的核心挑战，通过三大创新实现了突破：1）采用球面投影和Darknet53编解码网络架构，避免了传统2D投影导致的信息丢失；2）首创GPU加速的最近邻搜索替代CRF，有效消除语义粘连现象；3）开发了完整的标签回溯机制，能将CNN预测结果精准映射回原始点云。该技术不仅支持19类语义识别，还能在嵌入式系统实时运行，为自动驾驶和机器人导航提供了可靠的3D环境理解方案。

2025-07-16 10:00:00 576

原创 Python Fraction类实战：生成小学分数四则运算试卷

本文探讨Python的fractions模块在小学五年级分数运算教学中的应用。针对传统浮点数处理方式存在的精度丢失问题，重点解析Fraction类精确存储分数（分子/分母形式）的特性及其多种构造方法。通过演示字符串、小数及科学计数法的分数转换技术，特别强调使用Decimal对象避免浮点误差的解决方案。文章还介绍了如何结合random模块生成随机运算题，并利用Pillow库实现试卷可视化输出，为构建精确的分数四则运算考试系统提供完整技术方案。

2025-07-15 10:00:00 736

原创传感器大小端详解

本文介绍了计算机系统中的大小端概念，包括大端模式（高位字节存低地址）和小端模式（低位字节存低地址）的区别。文章通过0x12345678示例说明两种模式的存储方式，并列举了常见处理器架构的字节序。同时提供了通过联合体和指针转换两种判断系统大小端模式的方法，以及网络编程中常用的字节序转换函数（htonl/htons/ntohl/ntohs）。这些知识对系统开发、网络编程和理解计算机底层原理至关重要。

2025-07-14 10:00:00 398

原创 Buildroot实战指南：从零构建IMX6ULL嵌入式根文件系统

本文介绍了使用Buildroot构建嵌入式根文件系统的优势及方法。相比busybox，Buildroot集成了常见第三方库和软件，简化了移植过程。文章详细解析了Buildroot的目录结构、执行流程和编译机制，包括如何通过menuconfig配置选项、包下载编译过程以及映像文件制作。并以IMX6ULL平台为例，演示了从下载源码、配置选项到最终生成映像文件的具体操作步骤，同时指出了配置过程中可能遇到的错误及解决方法。

2025-07-13 10:00:00 321

原创机器人长周期任务规划：STEP技术如何解决“思维断层“和“注意力涣散“难题

针对机器人在执行长周期任务时面临的"思维断层"和"注意力涣散"两大痛点，研究者提出STEP（SubgoalTreeEmbodiedPlanner）创新框架。该技术采用分层树状结构分解任务，通过双模型协作机制实现：1）子目标分解模型递归拆解抽象指令为可执行动作；2）终止模型判断分解粒度是否达标。

2025-07-12 10:00:00 654

原创【广告算法】【基础】【0】广告算法作用和流程

本文系统介绍了广告算法的学习路径与实际应用价值。在信息爆炸时代，推荐系统扮演着三重角色：对平台是流量分配引擎，对用户是个性化助手，对商家则是曝光利器。其核心技术流程分为召回层（快速初筛）、粗排层（初步过滤）和精排层（精准排序）三大模块，核心思路是通过用户/物品向量化实现高效匹配。专栏将聚焦FM、双塔模型等普适性方法，以论文解读方式深入剖析推荐算法的底层逻辑，帮助读者构建从理论到实践的完整知识体系。

2025-07-11 10:00:00 877

原创从零搭建UBUS环境：OpenWrt进程间通信框架实战指南

本文介绍了在OpenWrt系统中搭建UBUS进程间通信框架环境的完整流程。首先概述了UBUS的核心组件（ubusd守护进程、libubus库、命令行工具及多语言支持），然后详细说明了安装步骤：包括JSON库、Lua语言环境、UBOX基础库以及UBUS本体的安装方法，并强调每个步骤都需要验证安装是否成功。文章为开发者提供了从零开始配置UBUS环境的实用指南，适用于机器人等嵌入式系统的开发场景。

2025-07-10 10:00:00 219

原创 PID控制及整定算法

PID控制算法通过比例、积分、微分三个环节实现精确控制。比例控制快速响应误差但存在稳态误差，积分控制消除稳态误差但响应滞后，微分控制预测误差趋势改善动态性能。三者结合形成PI或PID控制器，既保证响应速度又提高控制精度。参数整定是PID控制的核心，需平衡各环节强度：比例系数过大会导致振荡，积分时间影响误差消除速度，微分时间决定超前调节效果。采样周期选择也至关重要，需兼顾精度和计算效率。PID广泛应用于模拟和数字控制系统，通过负反馈实现稳定调节。

2025-07-09 10:00:00 1001

原创 PID参数自整定终极指南：基于继电反馈的智能调节算法详解

本文探讨了基于继电反馈的PID参数自整定算法。该算法通过设置整定模式和调节模式，在整定时利用继电器开关使系统产生周期性振荡，从而获取系统特征参数（临界增益Kc和振荡周期Tc），进而自动计算PID参数。文章详细介绍了描述函数法用于分析振荡波形特性的原理，以及如何从理想继电环节推导系统参数。这种自整定方法避免了人工调参的专业性要求，为PID控制器设计提供了自动化解决方案。

2025-07-08 10:00:00 256

原创具身智能机器人学习路线全解析

《具身智能机器人学习路线全解析》系统介绍了这一融合多学科的前沿技术领域。学习路径包含：1）数学物理基础（线性代数、力学等）；2）机器人学核心（机械结构、运动控制）；3）人工智能技术（机器学习、计算机视觉）。文章通过波士顿动力Atlas等案例，展示了高动态平衡、复杂运动等关键技术实现。该路线为学习者提供了从理论到实践的完整框架，涵盖编程、算法及硬件设计等关键技能。

2025-07-07 10:00:00 587

原创深入解析ARM Cortex-M处理器：状态、模式与栈寄存器全攻略

本文详细解析了ARM Cortex-M3/M4处理器的状态、模式与栈寄存器机制。处理器仅支持Thumb状态，分为线程模式和处理模式两种运行状态，具有特权和非特权两种访问等级。重点介绍了栈寄存器SP的双实体结构（MSP和PSP）及其在不同模式下的使用规则，CONTROL寄存器的配置方法，以及通过EXC_RETURN实现模式转换的机制。文章还阐述了访问等级（Ring0-Ring3）的分层保护原理及其在系统安全性中的作用，为理解处理器权限管理和异常处理机制提供了全面指导。

2025-07-06 10:00:00 1043

原创每日前沿技术分享——特权动作让机器人轻松掌握复杂长程操作任务

本文介绍了一种利用特权动作(PrivilegedAction)提升机器人强化学习效果的新方法。针对长期、接触丰富的操作任务，传统强化学习面临探索困难、容易陷入局部最优等问题。研究人员提出在模拟环境中使用物理上不可行但能增强探索的特权动作（如禁用碰撞、应用虚拟力），并结合课程学习逐步过渡到真实环境约束。该方法避免了依赖人工演示或精心设计的奖励函数，使机器人能更高效地自主学习复杂操作技能。实验表明，特权动作机制显著提升了机器人在长期任务中的表现。

2025-07-05 10:00:00 647

原创机器人锂电池技术科普梳理

智能AGV机器人锂电池技术发展现状与趋势摘要：随着智能搬运机器人广泛应用，锂电池技术成为关键因素。目前主流电池类型包括三元锂电池和磷酸铁锂电池，后者因安全性高、寿命长等优势市场份额持续增长（2024年达50.3%）。智能AGV机器人普遍采用48V电压，80Ah容量的锂电池配置。技术发展呈现三大特点：磷酸铁锂电池逐步替代三元锂电池，软包电池等新型封装工艺兴起，以及针对不同作业场景的定制化电池解决方案需求增加。未来锂电池技术将向更高能量密度、更强环境适应性和更长循环寿命方向发展。

2025-07-04 10:00:00 265

原创 RLHF常见问题

RLHF（基于人类反馈的强化学习）是AI领域的重要技术，通过将人类偏好融入模型训练提升语言模型性能。其流程包括预训练、奖励建模（训练RM模型量化人类偏好）和强化学习优化（使用PPO算法）。RM模型通常固定但可更新，价值模型（VM）则预测长期收益并辅助信用分配。折扣因子（γ=0.9或0.99）平衡即时与远期奖励，优势函数优化模型行为。该技术有效解决多目标优化问题，使生成内容更符合人类价值观。

2025-07-03 10:00:00 1551

原创每日前沿技术分享：VISK框架可以让机器人轻松完成插拔、刷卡等精细操作

研究人员提出VISK框架，利用AnySkin磁性触觉传感器和基于Transformer的策略学习架构，使机器人能够完成插拔插头、刷信用卡等精细操作。该框架包含视觉编码器、触觉编码器和观察主干三部分，通过融合多模态感知信息，解决了传统光学触觉传感器高维数据处理复杂的问题。实验表明，VISK框架在低维触觉数据支持下，显著提升了机器人执行精确接触式操作的能力。

2025-07-02 10:00:00 1043

原创【数据分析】如何在PyCharm中高效配置和使用SQL

PyCharm 作为 Python 开发者的首选 IDE，其 Professional 版本提供了强大的数据库集成功能，让开发者无需切换工具即可完成数据库操作。如果你使用的数据库没有列出（例如 MaxCompute），你可以选择 Generic SQL，这是一个通用的 SQL 方言，支持许多标准的 SQL 语法。PyCharm 的数据库工具窗口允许你连接到不同的数据库，并直接在 IDE 中运行 SQL 查询。在 SQL 方言设置页面，选择适合你使用的数据库的 SQL 方言。从弹出的菜单中，选择数据库类型。

2025-07-01 10:00:00 303

原创清华大学UniDetector：突破传统限制，打造零样本泛化的通用物体检测器

新类别区分能力：即使有了足够的训练数据，当遇到从未见过的新类别时，模型仍然容易产生偏差，倾向于预测那些出现在训练集中频率较高的类别。平衡已知与未知类别之间的关系：在一个开放的世界里，既存在大量已知的常见物体，也有许多未曾见过或罕见的新类别。如何让模型在这两者之间找到恰当的平衡点，既不会忽视稀有类别，又不会过度关注常见的部分，是另一个重要的考量因素。

2025-06-30 10:00:00 544

原创从TCP/UDP实验到AT命令解析与后台线程设计（下）

在后台线程的帮助下，APP才能发送AT命令，才能接收到网络数据

2025-06-29 10:00:00 180

原创从TCP/UDP实验到AT命令解析与后台线程设计（上）

对于WIFI模块，使用“AT_Device”结构体表示它，这个结构体里有一个“AT_Socket”结构体数组，每个“AT_Socket”里都有一个队列“recv_queue”（用来保存WIFI模块接收到的网络数据）。用户APP要使用网络时，先从“AT_Socket”数组里分配得到空闲的数组项，以后会使用这个结构体保存数据传输过程中的信息，比如WIFI模块里使用到的硬件socket号、本地ip/port、远端ip/port。当线程要接收网络数据时，它们只需要读取对应的“AT_Socket”结构体里的队列。

2025-06-28 10:00:00 400

空空如也

空空如也