temporal credit assignment in reinforcement learning 【强化学习 经典论文】

Sutton 出版论文的主页:

http://incompleteideas.net/publications.html

Phd  论文:   temporal credit assignment in reinforcement learning

http://incompleteideas.net/publications.html#PhDthesis

temporal credit assignment in reinforcement learning   【强化学习  经典论文】

最近在做强化学习方面的课题, 发现在强化学习方面被称作强化学习之父的  Sutton  确实很厉害, TD算法和策略梯度策略算法都是他所提出的, 虽然Reinforcement learning 的现在框架是从 Q-learning 开始确定的,但是强化学习做的最早的人之一,对强化学习中经典思想的贡献最多的人估计就是Sutton了,Sutton本硕都是在MIT读的心理学,博士阶段才读的计算机,看来确实是很强的。作为强化学习最经典的论文,也是Sutton的博士毕业论文,很是值得读一读的,寻找该篇论文许久,发现可能是由于该篇论文发表的时间过久,所以所有的数据库都没有收录,唯一收入的应该是Sutton的博士授予的大学 Massachusetts 马萨诸塞州大学,但是由于该文章只向本校学生开发,所以找了几天都没有找到,今天灵机一动,为什么不到作者的个人主页上找一找呢,这一弄还果然发现了它的存在,特此mark一下。

temporal credit assignment in reinforcement learning   【强化学习  经典论文】

----------------------------------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------------------------------

附:(Sutton主页  Publication部分内容)

Rich Sutton's Publications

First, a quick guide to the highlights, roughly in order of the work's popularity or potential current interest:

Also, some RL pubs that aren't mine, available for researchers:

For any broken links, please send email to
rich@richsutton.com.

上一篇:超硬核学习手册系列2查询篇——深入浅出MySQL的知识点,学习收藏必备


下一篇:MySQL ----- 计算字段(trim(),now(),Concat(),as) (九)