NetHack学习环境(NLE)使用教程

NetHack学习环境(NLE)使用教程

【免费下载链接】nle The NetHack Learning Environment 【免费下载链接】nle 项目地址: https://gitcode.com/gh_mirrors/nl/nle

1. 项目介绍

NetHack学习环境(NLE)是一个基于NetHack 3.6.6游戏的开源强化学习环境。NetHack 是一款历史悠久的视频游戏,以其丰富的实体和动态环境而著称。NLE 提供了一个标准的强化学习接口,允许研究者在游戏中评估他们的智能体。它的目标是使NetHack成为决策制定和机器学习研究的下一个挑战。

2. 项目快速启动

在开始之前,请确保您的系统中已安装了Python 3.5及以上版本和CMake 3.15及以上版本。

安装

使用Homebrew在MacOS上安装:
$ brew install cmake
在Ubuntu 18.04上安装:
# 安装Python和构建依赖
$ sudo apt-get install -y build-essential autoconf libtool pkg-config \
python3-dev python3-pip python3-numpy git flex bison libbz2-dev

# 安装最新版本的CMake
$ wget -O - https://apt.kitware.com/keys/kitware-archive-latest.asc | sudo apt-key add -
$ sudo apt-add-repository 'deb https://apt.kitware.com/ubuntu/ bionic main'
$ sudo apt-get update && sudo apt-get install -y cmake kitware-archive-keyring
创建并激活conda环境:
$ conda create -y -n nle python=3.8
$ conda activate nle
$ pip install nle

如果需要扩展或开发NLE,请按照以下步骤操作:

$ git clone https://github.com/facebookresearch/nle --recursive
$ pip install -e ".[dev]"
$ pre-commit install

运行环境

安装完成后,您可以尝试运行以下代码来测试环境:

import gym
import nle

env = gym.make("NetHackScore-v0")
env.reset()  # 每次重置都会生成一个新的地牢
env.step(1)  # 让代理 '@' 向北移动
env.render()  # 渲染环境

附加脚本

NLE还包含了一些脚本来进行环境回放和使用动作空间:

# 以人类玩家的方式玩NetHackStaircase-v0
$ python -m nle.scripts.play

# 使用随机代理
$ python -m nle.scripts/random_agent

3. 应用案例和最佳实践

以下是一些使用NLE的应用案例和最佳实践:

  • Inventory Management with Attention-Based Meta Actions:使用基于注意力的元动作进行库存管理的研究案例。
  • MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research:将NLE作为一个开放端强化学习研究沙盒的案例。
  • BeBold: Exploration Beyond the Boundary of Explored Regions:在探索过的区域之外进行探索的研究案例。

4. 典型生态项目

NLE的生态系统中包括以下典型项目:

  • NetHack Learning Dataset (NLD):与NLE一起提供的NetHack学习数据集,允许用户加载大型数据集并生成自己的数据集。
  • NLE Language Wrapper:由ngoodger实现的NLE语言包装器,将NetHack任务的非语言观察转换为类似语言的表示。

通过这些项目和案例,您可以更好地了解和利用NLE进行强化学习研究。

【免费下载链接】nle The NetHack Learning Environment 【免费下载链接】nle 项目地址: https://gitcode.com/gh_mirrors/nl/nle

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值