1. LiftCube-v0
dist_gripper_cube [approach]
表示机器人夹爪与目标方块之间的L2距离,用来衡量夹爪与方块的接近程度:[code]
dist_gripper_cube = np.linalg.norm(gripper_pos - cube_pos)
用途:
- 用于计算夹爪接近方块的阶段性奖励(
stage_reward -= 0.1 * dist_gripper_cube
) - 作为条件判断的关键阈值(当 dist_gripper_cube < 0.05 时认为夹爪足够接近方块)
- 用于区分任务的不同阶段(接近阶段、抓取阶段、提升阶段)