Functional Requirements for Reward-Modulated Spike-Timing-Dependent Plasticity

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!

Functional Requirements for Reward-Modulated Spike-Timing-Dependent Plasticity

 

The Journal of neuroscience : the official journal of the Society for Neuroscience, no. 40 (2010): 13326-13337

 

Abstract

  最近的实验表明,神经刺激调节了脉冲时序依赖可塑性。我们推导了大量关于奖励相关行为的学习规则成功学习的理论条件,其中,赫布突触可塑性以标志奖励的全局调节因子为条件。我们证明了该类别中的所有学习规则都可以分为捕获神经元激发和奖励的协方差的术语和代表无监督学习的影响的第二术语。 如果神经调节信号编码了奖励和预期奖励之间的差异,则可以抑制通常对基于奖励的学习有害的无监督术语,但前提是要分别为每个任务和刺激计算预期奖励。 如果要同时学习多个任务,则神经系统需要一个内部批评者,该批评者能够预测任意刺激的预期奖励。 我们表明,与批评家一样,奖励调制的依赖尖峰时序的可塑性能够以数十毫秒的时间分辨率学习运动轨迹。 讨论了与时差学习的关系,基于块的学习范式的相关性以及与批评者一起学习的局限性。

上一篇:02.flink打jar包时只打包代码,依赖jar包批量指定


下一篇:Web Performance Test: 如果使用Plugin过滤Dependent Request