DQN走迷宫
1.实现最短路径走到终点
游戏场景:黑点以每步两格的速度前进,可以任意方向行走,当撞墙后死亡 并重新开始
目的:黑点通过训练,能够自动识别障碍物,并以最短路径走向终点。
2.思路
黑点行走难点是如何准确判断下一步的动作(上下左右)?而这正是强化学习想要解决的问题。应用场景中,它的状态是图片中的像素,如果图片大小是 84 * 84,batch = 4,每个像素大小在[0,255]范围内,有 256 种可能(256 个状态)ÿ
2024-01-30 23:47:04
游戏场景:黑点以每步两格的速度前进,可以任意方向行走,当撞墙后死亡 并重新开始
目的:黑点通过训练,能够自动识别障碍物,并以最短路径走向终点。
黑点行走难点是如何准确判断下一步的动作(上下左右)?而这正是强化学习想要解决的问题。应用场景中,它的状态是图片中的像素,如果图片大小是 84 * 84,batch = 4,每个像素大小在[0,255]范围内,有 256 种可能(256 个状态)ÿ