强化学习所需要了解的知识
强化学习是一种机器学习方法,强化学习能够使Agent能够在交互式环境中年通过试验并根据自己的行动和经验反馈的错误来进行学习。
创建一个基本的强化学习问题,我们需要了解以下内容:
1.环境,也就是Agent操作的现实世界。
2.状态,也就是Agent的现状。
3.奖励,也就是来自环境的反馈。
4.策略,也就是将Agent的状态映射到动作的方法。
5.价值,也就是Agent在特定状态下采取行动所得到的报酬。
所以说,为了建立一个最优策略,Agent需要不断探索新的状态,同时最大化其所获奖励累积额度,这也被称作试探和权衡。