
iDP3 模型训练
文章平均质量分 88
iDP3 模型训练脚本分析
夜幕龙
该死的破智能制造中的咸鱼
展开
-
iDP3复现代码模型训练全流程(五)——gr1_dex_dataset_3d.py
该类继承自 BaseDataset,在其基础上增加了特定的数据预处理、采样和规范化功能。该数据集类的核心目的是管理和处理 3D 点云数据原创 2025-01-19 15:09:26 · 548 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(七)——diffusion_pointcloud_policy.py
此脚本的核心目的是搭建一个基于扩散模型(Diffusion Model)的策略生成架构,实现了一个基于扩散模型的点云策略类 DiffusionPointcloudPolicy,主要功能是使用点云数据作为输入,通过扩散模型生成动作(action)预测2. 推理阶段:使用点云观测条件,从随机初始化的序列中逐步生成符合条件的动作预测3. 损失函数:使用均方误差计算扩散模型预测与目标的偏差,优化模型参数原创 2025-01-12 23:35:44 · 931 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(六)——idp3_workspace.py
定义工作空间类,继承自 BaseWorkspace# 需要在检查点中包含的训练状态信息# 初始化工作空间# 设置随机种子,确保结果可复现# 配置模型,使用 Hydra 动态实例化# 如果启用了 EMA(指数移动平均),创建 EMA 模型try:self.ema_model = copy.deepcopy(self.model) # 尝试深拷贝模型except:# 如果模型某些组件(如稀疏张量引擎)无法拷贝,重新实例化# 配置优化器,动态加载优化器类型及参数# 初始化训练状态。原创 2025-01-12 20:15:11 · 497 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(四)——gr1_dex-3d.yaml
定义任务名称name: box# 定义输入输出的元数据,描述观测(obs)和动作(action)的形状和类型obs: # 定义观测数据的组成部分point_cloud: # 点云数据部分shape: [4096, 6] # 点云包含4096个点,每个点有6个维度type: point_cloud # 指定类型为点云agent_pos: # 低维特征,表示机器人的位置或状态shape: [32] # 低维状态表示为32维type: low_dim # 类型为低维特征原创 2025-01-12 10:22:29 · 724 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(三)——idp3.yaml
idp3.yaml 全逻辑可以总结为:任务定义: 训练一个扩散模型,用于点云数据的序列生成 ->数据编码: 使用PointNet对点云数据进行多阶段特征提取->扩散过程: 基于DDIMScheduler调度生成点云动作序列->训练优化: 使用AdamW优化器,通过余弦调度策略逐步降低学习率->结果管理: 配置检查点保存和日志记录,确保实验过程可控原创 2024-12-28 21:50:31 · 769 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(二)——train_policy.py
在 train_policy.sh 接收命令行参数后,通过此脚本加载配置文件、初始化工作空间并运行训练流程原创 2024-12-25 23:03:04 · 485 阅读 · 0 评论 -
iDP3复现代码模型训练全流程(一)——train_policy.sh
此脚本输入设置包括:算法名称、任务名称和其他配置信息,支持调试模式和训练模式,并集成wanb 作为日志记录工具原创 2024-12-24 22:50:49 · 845 阅读 · 1 评论