共绩算力 RTX 5090 极速部署 Stable Diffusion WebUI:新手也能秒开 AI 绘图工作站
本文详细介绍了在共绩算力RTX5090云主机上部署StableDiffusion WebUI的全流程方案。主要内容包括:1)选择共绩云主机的优势,如高端GPU支持、预装开发环境和弹性计费;2)从创建实例到环境配置的完整部署指南;3)WebUI的基础使用与进阶优化技巧;4)常见问题解决方案。该方案具有部署快速(30分钟完成)、成本低廉(1.68元/时起)等特点,特别适合需要高性能AI绘图但本地硬件不足的用户。教程还包含模型管理、插件安装等实用技巧,帮助用户充分发挥RTX5090的图形计算能力。
【保姆级教程】从零部署宇树 Unitree 机器人 ROS 2 环境 (Go2/B2/H1) (Humble + 真实硬件)
本文为希望在ROS 2 (Humble) 环境下开发宇树 (Unitree) 机器人(支持 Go2, B2, H1)的开发者提供了一篇详尽的、从零开始的部署指南。我们将首先在上安装,然后重点讲解如何配置功能包,实现 ROS 2 节点与机器人底层 DDS 系统的直接通信。本教程基于官方文档,并针对 Humble 环境进行了优化,可跳过 Foxy 版本复杂的 CycloneDDS 编译步骤。核心环境:Unitree Go2 / B2 / H1 (真实机器人)[TOC]宇树官方的仓库 (
论文笔记(一百零三)π0.6 : a VLA That Learns From Experience(一)
本文提出RECAP方法,通过优势条件策略实现视觉-语言-行动(VLA)模型的持续强化学习改进。该方法整合示教数据、自主执行数据和专家干预数据,采用离线强化学习预训练通用VLA模型π0.6,再通过真实机器人数据进行任务专业化。实验表明,完整RECAP流程能显著提升模型性能:在叠衣服、组装纸箱和操作咖啡机等复杂任务中,任务吞吐量提高2倍以上,失败率降低约一半。这使π0.6模型具备实际应用水平的鲁棒性,如连续13小时制作咖啡、2小时叠衣等。相比现有方法,RECAP支持更大规模模型训练,处理更复杂的真实世界任务。
Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解)
本文最开始属于此文《视频生成Sora的全面解析:从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》但考虑到DiT除了广泛应用于视频生成领域中,在机器人动作预测也被运用的越来越多,加之DiT确实是一个比较大的创新,影响力大,故独立成本文在ViT之前,图像领域基本是CNN的天下,包括扩散过程中的噪声估计器所用的U-net也是卷积架构,但随着ViT的横空出世,人们自然而然开始考虑这个噪声估计器可否用Transformer架构来代替2022年12月,William Peebles(
工业机器人类型识别与检测——基于YOLO11-C3k2-PFDConv的六种机器人自动识别系统详解_1
本文提出了一种基于改进YOLO11架构的工业机器人自动识别系统。该系统采用YOLO11-C3k2-PFDConv模型,结合多尺度C3k2模块和金字塔特征检测卷积(PFDConv),能够高效识别IRB、Kuka、Panda等六种常见工业机器人。系统包含数据采集、模型训练、推理识别和可视化四个模块,通过3000张工业机器人图像数据集进行训练。创新性地引入并行卷积分支和复合损失函数,提高了模型对多尺度目标的识别能力。实验结果表明,该系统在工业场景下具有较高的识别准确率和鲁棒性,为智能制造提供了可靠的技术支持。






