A*算法&博弈树α-β剪枝

2022-11-11 09:55:21

A*算法&博弈树α-β剪枝

A*算法/博弈树

　　前阵子考试学了A*算法、博弈树和回溯，自己真是愚蠢至极，根本没就搞明白这些，所以对于这些算法问道的话就不能说清楚，也记不住，所以才有了这篇笔记。在这里感谢面试我的那位工程师~~

　　A*算法

一些重要的概念

　　启发式信息：用于帮助减少搜索量的与问题有关的信息或知识。

　　启发式搜索：使用启发信息指导的搜索过程叫做启发式搜索。

　　估价函数：定义在状态空间上的实值函数。

　　open表：未扩展的节点

　　close表：已扩展或正在扩展的节点

用f(n)表示节点n的估价函数：

1. f(n)表示从起点到目标，经由节点n最小费用路径上费用的估计。（最短路径 = 目前最短 + 剩下的估计最短路径）

（在搜索图中，接近解路径的节点有较低的函数值）

2. 以估价函数f的递增次序排列OPEN表中的节点：

估价函数低的排在前；具有相等函数值的节点以任意次序排序。

A算法与A*算法

　　A算法: 使用估价函数f(n)=g(n)+h(n) 排列OPEN表中节点顺序的graphsearch算法。

g(n)：对g*(n)的一个估计，是当前的搜索图G中s到n的最优路径费用 g(n)≥g*(n)

h(n)：对h*(n)的估计，是从n到目标节点的估计代价，称为启发函数。

例如：当h(n) = 0, g(n) = d, 则f(n) = g(n)就变为了宽度优先搜索，也就是如果不需要启发，那就是宽度优先搜索的算法了。

　　A*算法：一种静态路网中求解最短路最有效方法。与A算法不同，对任何节点n都有h(n)≤h*(n)的A算法。

例子

　　八数码问题：利用估价函数f(n)=d(n)+W(n)正向搜索八数码难题，其中d(n)为深度,W(n)为目标的偏差数。

　　解题步骤不做介绍，很简单，相信一会百度的。

感想

　　A*算法与以往的图的搜索算法不同，是一种启发式的算法，通过设计一种恰当的估计函数，越是接近真实值，就越会掉地搜索的成本，降低算法的开销。这样的话，估计的函数的设计就尤为重要了。

博弈树

　　博弈树是指由于动态博弈参与者的行动有先后次序，因此可以依次将参与者的行动展开成一个树状图形。

博弈

　　对于任何一种博弈竞赛，我们可以构成一个博弈树。它类似于状态图和问题求解搜索中使用的搜索树。博弈树的结点对应于某一个棋局，其分支表示走一步棋；根部对应于开始位置，其叶表示对弈到此结束。在叶节点对应的棋局中，竞赛的结果可以是赢、输或者和局。

极大极小分析方法

　　在二人博弈问题中，为了从众多可供选择的行动方案中选出一个对自己最为有利的行动方案，就需要对当前的情况以及将要发生的情况进行分析，通过某搜索算法从中选出最优的走步。

　　基本思想或算法是：

　　(1) 设博弈的双方中一方为MAX，另一方为MIN。然后为其中的一方寻找一个最优行动方案。
　　(2) 为了找到当前的最优行动方案，需要对各个可能的方案所产生的后果进行比较,具体地说，就是要考虑每一方案实施后对方可能采取的所有行动，并计算可能的得分。
　　(3) 为计算得分，需要根据问题的特性信息定义一个估价函数，用来估算当前博弈树端节点的得分。此时估算出来的得分称为静态估值。
　　(4) 当端节点的估值计算出来后，再推算出父节点的得分，推算的方法是：对“或”节点，选其子节点中一个最大的得分作为父节点的得分，这是为了使自己在可供选择的方案中选一个对自己最有利的方案；对“与”节点，选其子节点中一个最小的得分作为父节点的得分，这是为了立足于最坏的情况。这样计算出的父节点的得分称为倒推值。
　　(5) 如果一个行动方案能获得较大的倒推值，则它就是当前最好的行动方案。

　　在博弈问题中，每一个格局可供选择的行动方案都有很多，因此会生成十分庞大的博弈树。试图利用完整的博弈树来进行极小极大分析是困难的。所以才有了α-β剪枝。

α-β剪枝

　　为了提高搜索的效率，引入了通过对评估值的上下限进行估计，从而减少需进行评估节点的范围。

主要概念：

MAX节点的评估下限值α：

　　作为MAX节点，假定它的MIN节点有N个，那么当它的第一个MIN节点的评估值为α时，则对于其它节点，如果有高于α的节点，就取那最高的节点值作为MAX节点的值；否则，该点的评估值为α。

MIN节点的评估上限值β：

　　作为MIN节点，同样假定它的MAX节点有N个，那么当它的第一个MAX节点的评估值为β时，则对于其他节点，如果有低于β的节点，就取最低的节点值作为MIN节点的值；否则，该店的评估值为β。

主要思想：

　　可以分为两个步骤，分别为α剪枝和β剪枝。

　　如图：

标签: 数据结构与算法

码农公寓