基本以DQN和Rainbow为核心画的图。
左边虚线框是DNN(DL,deeplearning)出现之前的强化学习算法和技巧。
分别对应到DQN一家的特定算法。还有一些其他算法没有被rainbow采用的就单独画在了下面的虚线框里。
2024-01-22 17:25:29
基本以DQN和Rainbow为核心画的图。
左边虚线框是DNN(DL,deeplearning)出现之前的强化学习算法和技巧。
分别对应到DQN一家的特定算法。还有一些其他算法没有被rainbow采用的就单独画在了下面的虚线框里。