Ubuntu22.04深度强化学习环境配置Spinningup

部署运行你感兴趣的模型镜像

一、Ubuntu22.04下Anaconda的安装,参考

1.安装依赖

apt install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6

2.下载Anaconda安装包

安装Anaconda的最佳方法是下载最新的Anaconda安装程序bash脚本并运行即可实现安装。

各版本下载界面指路

下载举例

wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh

然后运行刚刚下载下来的脚本,一路回车+yes

sh Anaconda3-2022.10-Linux-x86_64.sh

3.修改.bashrc

在~/.bashrc文件末尾加上:

export PATH="~/anaconda3/bin":$PATH
source ~/anaconda3/bin/activate

后执行:

source ~/.bashrc

成功!!!

二、安装GPU版本pytorch (超简单!!!)

pytorch的安装超级简单,其实只需要一行代码

1.查看cuda版本

  • 这行代码中间没有空格,切记!*
nvidia-smi

结果如下

在这里插入图片描述
看到CUDA Version : 12.2,接着到pytorch官网,选择对应的pytorch版本:
(修改,这里不应该是通过nvidia-smi查看cuda版本(该命令查看的是nvidia驱动支持的最高的cuda版本),而应该使用nvcc -V命令)
在这里插入图片描述

2.复制命令,在虚拟环境中粘贴运行即可:

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

等待安装完成,测试如下:
在这里插入图片描述

三、spinningup+mujoco 安装

整体参考官方文档的“安装”部分

1.spinningup包

git clone https://github.com/openai/spinningup.git
cd spinningup
pip install -e .

官网的安装依赖项如下:

‘cloudpickle==1.2.1’,

cloudpickle 是一个 Python 库,它提供了一种可以序列化任意 Python
对象的方式,以便将它们发送到远程计算机、保存到磁盘或发送到其他进程。cloudpickle 库的功能类似于标准库中的 pickle 模块,但它可以序列化更多类型的 Python 对象,并且在处理大型数据集合时通常更高效。

cloudpickle 可以轻松地序列化常见的 Python 对象,例如函数、类、lambda 函数、闭包等,而标准的 pickle 模块可能无法序列化这些对象。

‘gym[atari,box2d,classic_control]~=0.15.3’

gym 是由 OpenAI 开发的一个用于开发和比较强化学习算法的工具包。它提供了一个简单一致的接口,用于控制和管理各种强化学习环境,包括经典的控制问题和游戏。

ipython

IPython是一个增强的Python交互式解释器,它提供了一些有用的功能,使得在命令行中使用Python更加简便和高效。IPython具有以下几个主要特点:
交互式计算环境:IPython提供了一个交互式的环境,用户可以直接在命令行中输入Python代码并获得即时的结果。这对于快速原型设计和数据分析非常有用。
tab补全和自动完成:IPython具有强大的Tab补全功能,当你输入对象的名称时,按下Tab键可以自动完成对象的属性和方法名,这有助于减少输入错误和提高工作效率。
内置的文档和帮助系统:IPython允许用户通过文档字符串和特殊的“?”符号来获取有关对象、模块和函数的帮助文档。这可以节省用户查找文档的时间,同时避免在浏览器或其他文档查找工具间切换。
丰富的显示输出:IPython可以在命令行中以更富有信息量的方式显示对象或绘图结果,例如以表格形式显示数据或在嵌入的图形用户界面中显示绘图结果。这使得数据可视化和探索变得更加方便。
支持Jupyter Notebook

joblib

Joblib 是一个用于在 Python 中进行并行化计算的库。它提供了一些用于高性能计算和数据处理的工具,特别是在处理大规模数据集时效果非常显著。

matplotlib==3.1.1

Matplotlib 是一个用于绘制 2D 图形的 Python 库,它提供了许多工具用于创建各种类型的图表、图形和可视化,并为科学计算和数据分析提供了强大的支持。

mpi4py

mpi4py 是一个 Python 的 MPI(Message Passing Interface)标准的接口实现库,它允许 Python 程序在并行计算环境中进行通信和协作。MPI 是一种并行计算中常用的标准,可以用于多个进程之间的数据传输和通信。

numpy

Python 的一个用于数值计算的库,它提供了高性能的多维数组对象以及用于处理数组的工具。

pandas

Pandas 是一个开源的数据分析工具包,主要用于数据处理和数据分析。它提供了快速、强大、灵活且易于使用的数据结构,使得用 Python 进行数据清洗、数据分析和数据可视化变得更加简单和高效。

pytest

pytest 是一个流行的 Python 测试框架,用于编写和运行单元测试、集成测试和功能测试。

psutil

psutil 是一个用于获取系统信息和进程管理的 Python 库。它提供了一种跨平台的方式来检索有关系统资源利用情况(如 CPU、内存、磁盘、网络),以及进程信息(如进程ID、内存占用、CPU利用率)的功能。

scipy

Scipy 是一个基于 Python 的开源科学计算库,它建立在 NumPy 数组对象之上,为科学和工程应用程序提供了丰富而强大的功能。Scipy 为用户提供了许多有用的工具和功能,包括数值积分、优化、统计和线性代数等各种科学计算功能。

seaborn==0.8.1

Seaborn 是一个基于 Matplotlib 的 Python 数据可视化库,专注于创建统计图表和信息图形。它旨在使创建具有吸引力和信息丰富的统计图表变得更加简单,提供了丰富的默认主题和调色板,以及用于可视化数据集中数据关系的函数。

tqdm

tqdm 是一个用于在 Python 中显示进度条的快速、可扩展的库。它可以在循环或迭代过程中显示一个实时的进度条,让用户清楚地了解任务的完成情况。tqdm 提供了对迭代过程的实时监控,可以在终端中显示进度条、剩余时间、每秒处理的数据量等信息。

tensorflow和torch不再解释。

安装文件中给的tensorflow版本为一个范围: ‘tensorflow>=1.8.0,<2.0’,但我在第一次安装1.8.0版本后运行测试代码会报错:
AttributeError: module 'tensorflow.compat' has no attribute 'v1'原因是版本不对,尝试下载安装1.13.2版本运行成功。

torch版本:torch==1.3.1

运行报错,解决

最后成功,目前为止跟mujoco没有任何关系:
在这里插入图片描述

2.mujoco,mujoco_py,gym安装

主要参考:Mujoco210 Ubuntu 22.04配置安装(一),报错就看日志去找解决办法,过程艰难,要有耐心。
提示:某些动态链接相关的库安装或更新后需要重启电脑才能生效。
安装顺序mujoco——>mujoco_py——>gym,每一步都保证完全成功再进行下一步,最后安装下来的版本是mjpro150(gym好像只能匹配这个版本)最后运行官网文档测试代码结果如图:
在这里插入图片描述

大功告成!!!

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

<think>好的,我现在需要帮助用户在Ubuntu 22.04上配置强化学习环境,包括必要的依赖和库。首先,我得回顾一下用户提供的参考引用,确保信息准确。 用户提到了三个引用,分别关于Ubuntu系统初始化配置、Anaconda安装和MuJoCo的安装。首先,我应该按照这些步骤来组织回答,同时确保LaTeX格式正确,并且生成相关问题。 第一步是系统初始化配置。根据引用[1],需要安装一些基础依赖,比如GPU驱动,但用户可能使用的是NVIDIA RTX 4080,所以需要确认驱动安装步骤。不过用户的问题中没有特别提到GPU驱动的部分,可能需要包含进去,但引用[1]里提到了系统初始化配置,可能包括更新系统和安装必要工具,比如build-essential等。 接下来是安装Anaconda,引用[2]详细说明了安装依赖和下载Anaconda的步骤。这里需要确保用户正确安装依赖项,并正确设置环境变量。同时,创建conda环境是常见的做法,所以需要指导用户创建并激活环境。 然后是安装深度学习框架,比如PyTorch或TensorFlow。这部分用户没有直接提到,但强化学习环境通常需要这些库。需要根据用户的引用,可能结合Spinning Up的配置,这里引用[2]提到了Spinning Up的环境配置,可能需要安装MuJoCo相关库。 关于MuJoCo的安装,引用[3]指出需要安装MuJoCo210和mujoco-py,但需要注意版本兼容性,比如mujoco-py的版本要控制在2.1到2.2之间。这部分可能会有问题,需要详细说明如何下载MuJoCo并设置环境变量,然后通过pip安装。 另外,可能需要安装其他强化学习库,比如OpenAI Gym、Stable Baselines等。这些内容虽然用户没有直接引用,但属于常见的配置步骤,应该包括进去。 现在需要检查步骤是否符合逻辑,是否遗漏了某些环节。例如,系统更新、安装依赖、Anaconda环境、深度学习框架、MuJoCo、其他库等。同时,确保每个步骤的命令正确,特别是关于路径设置和环境变量。 可能遇到的问题包括:依赖项安装失败、Anaconda路径设置、MuJoCo许可证密钥的获取、mujoco-py版本兼容性问题。需要提醒用户注意这些问题,并提供解决方法,比如下载MuJoCo后放置到~/.mujoco目录,并设置LD_LIBRARY_PATH等。 最后,生成相关问题需要考虑用户在配置过程中可能遇到的后续问题,比如性能优化、环境验证、特定工具包的安装,以及虚拟环境的必要性。 总结步骤: 1. 系统更新与基础依赖安装 2. 安装Anaconda并配置环境 3. 创建并激活conda环境 4. 安装PyTorch或TensorFlow 5. 安装MuJoCo和mujoco-py 6. 安装强化学习库(如Gym、Spinning Up) 7. 验证安装 在每个步骤中需要正确使用命令,并注意路径和版本号,确保用户能顺利执行。同时,引用相关的参考资料,如引用[2]和[3]中的步骤。</think>### 在 Ubuntu 22.04 上配置强化学习环境的步骤 #### 1. **系统初始化配置** - 更新系统并安装基础工具: ```bash sudo apt update && sudo apt upgrade -y sudo apt install build-essential libgl1-mesa-glx libegl1-mesa libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 -y ``` 这些依赖库支持图形界面、硬件加速和基础开发环境[^2][^3]。 #### 2. **安装 Anaconda** - 下载并安装 Anaconda(以 Python 3.9 版本为例): ```bash wget https://repo.anaconda.com/archive/Anaconda3-2023.03-Linux-x86_64.sh bash Anaconda3-2023.03-Linux-x86_64.sh ``` 安装完成后,重启终端并初始化 conda: ```bash source ~/.bashrc ``` #### 3. **创建并激活虚拟环境** ```bash conda create -n rl_env python=3.9 conda activate rl_env ``` 虚拟环境可隔离依赖库版本冲突。 #### 4. **安装深度学习框架** - PyTorch(根据 CUDA 版本选择): ```bash pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 ``` - 或 TensorFlow: ```bash pip install tensorflow[and-cuda] ``` #### 5. **安装 MuJoCo 物理引擎** - 下载 MuJoCo 210: ```bash wget https://mujoco.org/download/mujoco210-linux-x86_64.tar.gz mkdir ~/.mujoco && tar -xzf mujoco210-linux-x86_64.tar.gz -C ~/.mujoco ``` - 设置环境变量: ```bash echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/.mujoco/mujoco210/bin' >> ~/.bashrc source ~/.bashrc ``` - 安装 mujoco-py: ```bash pip install 'mujoco-py<2.2,>=2.1' # 版本需与 MuJoCo 210 兼容 ``` #### 6. **安装强化学习库** - OpenAI Gym: ```bash pip install gym[all] ``` - Stable Baselines3: ```bash pip install stable-baselines3 ``` - Spinning Up(OpenAI 的强化学习框架): ```bash git clone https://github.com/openai/spinningup.git cd spinningup && pip install -e . ``` #### 7. **验证环境** - 测试 Gym 和 MuJoCo: ```python import gym env = gym.make('Ant-v4') env.reset() for _ in range(1000): env.step(env.action_space.sample()) env.render() ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值