1 目标
配置 Emergent Tool Use from Multi-Agent Interaction 博客所使用的环境。
2 使用环境
- Ubuntu 16.04 +
- VMware Workstation 16 Pro
3 配置流程
3.1 安装 mujoco
3.1.1 下载 mjpro150 linux:
https://www.roboti.us/index.html
3.1.2 下载 Activation key:
https://www.roboti.us/license.html
3.1.3 在 home 目录下创建隐藏文件夹 mujoco,将下载完成的安装包解压到该文件夹:
mkdir ~/.mujoco
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip
3.1.4 将 mjkey.txt
放到 ~/.mujoco
和 ~/.mujoco/mjpro150/bin
位置下:
cp mjkey.txt ~/.mujoco
cp mjkey.txt ~/.mujoco/mjpro150/bin
3.1.5 添加环境变量:
打开 ~/.bashrc
文件:
gedit ~/.bashrc
添加以下命令:
export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}
在终端输入命令并重启终端使添加的环境变量生效:
source ~/.bashrc
3.1.6 运行测试
cd ~/.mujoco/mjpro150/bin
./simulate ../model/humanoid.xml
3.2 安装 Anaconda3
安装 Anaconda3 遇到的问题可参考其他博客。
3.2.1 下载 Anaconda3 镜像:
通过清华大学开源软件镜像站下载,下载最新版即可,这里下载的是 Anaconda3-2021.05-Linux-x86_64.sh
。
3.2.2 在终端进行安装:
bash Anaconda3-2021.05-Linux-x86_64.sh
安装完后重启一下终端。
3.3 安装 mujoco-py
3.3.1 创建虚拟环境并且切换到该虚拟环境:
conda create -n multi-agent-emergence python=3.6 numpy
conda activate multi-agent-emergence
3.3.2 预先安装需要的包:
sudo apt-get install libgl1-mesa-dev libgl1-mesa-glx libosmesa6-dev python3-pip python3-numpy python3-scipy patchelf
conda install -c anaconda patchelf
3.3.3 安装 mujoco-py:
pip install -U 'mujoco-py<1.50.2,>=1.50.1'
至此,准备工作已经全部完成了,之后就按照 GitHub 上的 README 安装即可。
3.4 安装 mujoco-worldgen
3.4.1 下载代码库到本地:
https://github.com/openai/mujoco-worldgen
3.4.2 安装 mujoco-worldgen:
在解压好的 mujoco-worldgen 文件夹下打开终端:
pip install -r requirements.txt
pip install -e .
3.5 安装 multi-agent-emergence-environments
3.5.1 下载代码库到本地:
https://github.com/openai/multi-agent-emergence-environments
3.5.2 安装 multi-agent-emergence-environments:
在解压好的 multi-agent-emergence-environments 文件夹下打开终端:
pip install -e .
3.5.3 游玩 saved policies:
3.5.3.1 预先安装需要的包:
sudo apt-get install libopenmpi-dev
3.5.3.2 按照 README 预先安装需要的包:
pip install -r multi-agent-emergence-environments/requirements_ma_policy.txt
3.5.3.3 使用 bin/examine
游玩 saved policies:
bin/examine.py examples/hide_and_seek_quadrant.jsonnet examples/hide_and_seek_quadrant.npz
4 参考
强化学习环境配置(Ubuntu14.04)—gym、mujoco、mujoco-py、baselines
【Linux】Ubun16.04服务器配置Mujoco的各种错误解决方案
【解决方案】安装mpi4py时报错:error: Cannot compile MPI programs. Check your configuration!!