原文:HTML
作者:Thomas Simonini
翻译:datamonday
这篇文章是深度强化学习(Deep Reinforcement Learning,Deep RL)课程的一部分。该课程是一门适合初学者的的免费课程,相关课件可以访问课程主页。
深度RL是一种机器学习,代理(agent)可以通过执行动作和查看结果来学习如何在环境中表现。
自2013年的Deep Q-Learning论文以来,我们看到了很多突破。从击败世界上最好的Dota2玩家的OpenAI五人组,到Dexterity项目,Deep RL的研究是激动人心的。
此外,自该课程于2018年发布以来,大量新库(TF-Agents,Stable-Baseline 2.0…)和发布的环境包括:MineRL(Minecraft),Unity ML-Agents,OpenAI retro(NES,SNES,Genesis games…)如雨后春笋般涌现。现在可以从许多开源库中来建立自己的代理。
所以现在是开始学习的最佳时机,有了这个课程你就对了。是的,因为这篇文章是《Deep RL Course v2.0》的第一章,这是一门从初学者到专家的免费课程,在这里你将掌握所需的技能和架构,成为深度强化学习专家。
在本课程中,你将通过使用Tensorflow和PyTorch实现令人敬畏的代理,学会玩Space invaders、Minecraft、Starcraft、Sonic the hedgehog等,建立一个强大的专业组合!
所以在这第一章,你将学习深度强化学习的基础。
在深入实施深度强化学习代理之前,掌握这些要素真的很重要。本章的目标是给你打下坚实的基础。
如果你喜欢,你可以观看本章的