Minigrid项目环境创建教程：从零开始构建自定义网格世界

施刚爽

于 2025-06-25 09:09:27 发布

阅读量298

点赞数 5

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00064/article/details/148889796

Minigrid项目环境创建教程：从零开始构建自定义网格世界

Minigrid Simple and easily configurable grid world environments for reinforcement learning 项目地址: https://gitcode.com/gh_mirrors/mi/Minigrid

前言

本文将详细介绍如何在Minigrid项目中创建自定义网格环境。Minigrid作为一个轻量级的网格世界环境库，广泛应用于强化学习研究和算法测试。通过本教程，您将学会如何构建包含墙壁、目标、钥匙和门等元素的完整环境。

环境类基础结构

首先需要创建一个继承自MiniGridEnv的子类，这是所有Minigrid环境的基类。以下是基础框架示例：

class SimpleEnv(MiniGridEnv):
    def __init__(
        self,
        size=8,
        agent_start_pos=(1, 1),
        agent_start_dir=0,
        max_steps: int | None = None,
        **kwargs,
    ):
        self.agent_start_pos = agent_start_pos
        self.agent_start_dir = agent_start_dir

        mission_space = MissionSpace(mission_func=self._gen_mission)

        super().__init__(
            mission_space=mission_space,
            grid_size=size,
            max_steps=256,
            **kwargs,
        )

    @staticmethod
    def _gen_mission():
        return "完成指定任务"

关键点说明：

mission_space定义了环境的任务描述
grid_size设置环境网格的大小
max_steps限制智能体的最大步数

网格世界生成逻辑

核心方法是重写_gen_grid函数，它负责构建实际的网格环境：

def _gen_grid(self, width, height):
    # 创建空网格
    self.grid = Grid(width, height)
    
    # 生成外围墙壁
    self.grid.wall_rect(0, 0, width, height)
    
    # 放置智能体
    if self.agent_start_pos is not None:
        self.agent_pos = self.agent_start_pos
        self.agent_dir = self.agent_start_dir
    else:
        self.place_agent()

环境元素添加方法

1. 添加目标位置

self.put_obj(Goal(), width - 2, height - 2)

这会在网格右下角放置一个目标点，智能体到达该位置即完成任务。

2. 创建分隔墙

for i in range(0, height):
    self.grid.set(5, i, Wall())

这会在x=5的位置创建一堵垂直墙，将环境分为两个区域。

3. 添加门和钥匙系统

首先需要导入相关类：

from minigrid.core.constants import COLOR_NAMES
from minigrid.core.world_object import Door, Key

然后放置门和对应的钥匙：

self.grid.set(5, 6, Door(COLOR_NAMES[0], is_locked=True))
self.grid.set(3, 6, Key(COLOR_NAMES[0]))

这样就在(5,6)位置创建了一个上锁的门，在(3,6)位置放置了对应的钥匙。

完整示例代码

from minigrid.core.constants import COLOR_NAMES
from minigrid.core.grid import Grid
from minigrid.core.mission import MissionSpace
from minigrid.core.world_object import Door, Goal, Key, Wall
from minigrid.minigrid_env import MiniGridEnv

class SimpleEnv(MiniGridEnv):
    def __init__(self, size=10, **kwargs):
        mission_space = MissionSpace(mission_func=lambda: "找到钥匙并到达目标")
        super().__init__(
            mission_space=mission_space,
            grid_size=size,
            see_through_walls=True,
            max_steps=4*size**2,
            **kwargs
        )

    def _gen_grid(self, width, height):
        self.grid = Grid(width, height)
        
        # 外围墙壁
        self.grid.wall_rect(0, 0, width, height)
        
        # 分隔墙
        for i in range(height):
            self.grid.set(5, i, Wall())
        
        # 门和钥匙
        self.grid.set(5, 6, Door(COLOR_NAMES[0], is_locked=True))
        self.grid.set(3, 6, Key(COLOR_NAMES[0]))
        
        # 目标位置
        self.put_obj(Goal(), width-2, height-2)
        
        # 随机放置智能体
        self.place_agent()

环境测试与调试

创建环境后，可以通过以下方式测试：

env = SimpleEnv(render_mode="human")
env.reset()
env.render()

使用方向键控制智能体移动，观察其与环境的交互是否符合预期。

进阶建议

可以尝试添加更多类型的物体，如可移动的箱子
实现更复杂的任务逻辑，如收集多个物品
设计多层迷宫结构
添加动态变化的元素

Minigrid Simple and easily configurable grid world environments for reinforcement learning 项目地址: https://gitcode.com/gh_mirrors/mi/Minigrid

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考