自适应大领域搜索算法(ALNS) 详解及python示例

2023-03-16 22:55:02

1 前言

有关TSP问题的求解方法层出不穷，遗传算法、模拟退火、粒子群算法之类的介绍已经比较多了，但是发现关于自适应大领域搜索算法(Adaptive Large Neighborhood Search, ALNS)的介绍比较少，而且示例代码注释不太详细，刚接触的时候学起来有点费劲，就把学习资料和自己理解的过程简单写一下，造福和我一样的菜鸟吧。

2 什么是自适应大领域搜索

概念理解：干货 | 自适应大邻域搜索(Adaptive Large Neighborhood Search)入门到精通超详细解析-概念篇

优点、步骤和python示例代码：自适应大邻域搜索算法

参考文献及算法应用：
[1]王新. 车辆和无人机联合配送路径问题研究[D].大连海事大学,2020.
[2]李婷玉. 多商户多车程同城物流配送车辆调度问题研究[D].大连理工大学,2018.
[3]张梦颖. 不确定因素下路径规划问题研究[D].中国科学技术大学,2016.

简而言之，自适应大领域搜索的核心思想是：破坏解、修复解、动态调整权重并选择（自适应）。通过设计多组破坏算子和修复算子，扩大解空间搜索范围，对当前解进行改进，表现好的破坏和修复方法相应地得到高分，权重也越高。在每次迭代中，根据以往表现对各个破坏和修复算子进行选择和权重调整，使用高效的组合方法，提高算法寻优能力，从而找到最优解。

2.1 破坏算子（destroy）

破坏解的方法主要有随机移除、最差移除、相似移除等。其中，随机移除删除当前解决方案中的任意节点；最差移除删除当前解决方案中距离较长的路段。

先破坏再修复，这一步得到破坏后的解和移除的节点列表。如，当前解（TSP城市访问顺序）为【1, 4, 2, 3】，随机删除节点4后，得到破坏后的解【1, 2, 3】

2.2 修复算子（repair）

修复解的方法主要有随机插入、贪婪插入等。其中，随机插入将移除的节点逐个插入到破坏后解的任意位置；贪婪插入将移除的节点插到距离成本最小，即插入后总路径最短的位置中。

修复操作的对象是破坏后的解和移除的节点列表，将移除的节点重新插入到破坏后的解中，得到完整的、新的一组解。如，将2.1中的移除节点4，随机插入到破坏后的解【1, 2, 3】中，可得【1, 2, 3, 4】

需要选择至少两组破坏和修复算子加入算法，更多的算子介绍详见上面的参考文献，也可以根据问题特性自行设计其他的破坏或修复算子。

2.3 动态调整权重并选择（自适应过程）

算法在迭代时根据算子权重和轮盘赌的方式选择、调整破坏算子和修复算子。

（1）权重更新

算子的权重按这个公式进行更新：
式中，Wd为算子权重，Sd为算子分数，Ud为算子的使用次数，ρ为权重更新系数（控制权重变化的速度）。其实就是：算子新权重 = 算子旧权重 × （1 - 系数） + 系数 × （累加分数 ÷ 累加次数），将算子权重与以往表现挂钩。

在开始时，所有算子均具有相同的权重和分值。而分数，则是在每个迭代过程中，根据算子的不同表现情况阶梯式给分，得分越高表明算子表现越好。可设定以下4种加分情况：

（1）破坏/修复后得到新的全局最优解，+1.5分
（2）破坏/修复后没有得到全局最优解：
①尚未接受过的但比当前解好，+1.2分
②尚未接受过的且比当前解差：
a)在一定标准下接受劣解，+0.8分
b)不满足接受准则的劣解，+0.6分

阶梯分数自己定，1.5、1.2为示例。搜索过程中，若只接受优解容易陷入局部最优，为了避免这种情况应采用一定准则接受劣解。自适应大领域搜索中通常采用模拟退火算法Metropolis准则，在一定概率下接受劣解。

模拟退火算法的介绍：深度学习 — 模拟退火算法详解（Simulated Annealing， SA）

（2）轮盘赌选择算子

得到新的权重后，算法基于轮盘赌的思想对算子进行选择，使算子被选中的概率与其权重表现成正比。

轮盘赌介绍：Evolutionary Computing: 遗传算法_轮盘赌选择（转载）

3 python代码示例及详解

了解了上面的内容之后，下面这个示例代码就很容易理解了。

优点、步骤和python示例代码：自适应大邻域搜索算法

原来的程序把两个轮盘赌函数放在了前面。为了方便理解，我把函数定义的顺序换了一下，由简到易，先分块注释：

（1）导入库，输入城市两两距离矩阵

import numpy as np
import random as rd
import copy

distmat = np.array([[0,350,290,670,600,500,660,440,720,410,480,970],
                 [350,0,340,360,280,375,555,490,785,760,700,1100],
                 [290,340,0,580,410,630,795,680,1030,695,780,1300],
                 [670,360,580,0,260,380,610,805,870,1100,1000,1100],
                 [600,280,410,260,0,610,780,735,1030,1000,960,1300],
                 [500,375,630,380,610,0,160,645,500,950,815,950],
                 [660,555,795,610,780,160,0,495,345,820,680,830],
                 [440,490,680,805,735,645,495,0,350,435,300,625],
                 [720,785,1030,870,1030,500,345,350,0,475,320,485],
                 [410,760,695,1100,1000,950,820,435,475,0,265,745],
                 [480,700,780,1000,960,815,680,300,320,265,0,585],
                 [970,1100,1300,1100,1300,950,830,625,485,745,585,0]])

（2）定义目标函数计算距离 —— disCal( )

已知访问顺序path，求经过的路径长度distance。

def disCal(path):    
    distance = 0          #若路径为path = 【1，2, 3】，len（path）=3
    for i in range(len(path) - 1):         #先循环两遍，求1-2和2-3的距离之和
        distance += distmat[path[i]][path[i + 1]]
    distance += distmat[path[-1]][path[0]]   #从起点出发，回到原来出发的城市，求首尾相连的距离，即3-1
    return distance

（3）定义第一个摧毁算子 —— 随机移除randomDestroy( )

随机移除3个城市。输入当前解sol，输出需要移除的城市列表removed。

def randomDestroy(sol):
    solNew = copy.deepcopy(sol)
    removed = []
    removedIndex = rd.sample(range(0, distmat.shape[0]), 3)   #sample随机选取3个城市序号并存入列表,distmat.shape[0]得到距离矩阵维度，即城市总个数
    for i in removedIndex:   
        removed.append(solNew[i])    #将需要移除的城市添加到removed列表
        sol.remove(solNew[i])        #移除后剩下的城市列表
    return removed

（4）定义第二个摧毁算子 —— 最大3段距离移除max3Destroy( )

移除最长的3段距离。输入当前解sol，输出需要移除的城市列表removed。内部过程比随机移除复杂。

def max3Destroy(sol):
    solNew = copy.deepcopy(sol)
    removed = []
    dis = []
    for i in range(len(sol) - 1):
        dis.append(distmat[sol[i]][sol[i + 1]])      #在距离矩阵中选取路段的长度，如【1,2,3】，循环两次求1-2,2-3的距离，
    dis.append(distmat[sol[-1]][sol[0]])      #选取首尾的距离3-1，放入dis列表
    disSort = copy.deepcopy(dis)
    disSort.sort()     #sort对disSort进行排序，默认升序
    for i in range(3):     #判断最长的3个路段并移除
        if dis.index(disSort[len(disSort) - i -1]) == len(dis) - 1:
            #如果是距离列表的最后一个，就是城市首尾相连的距离，则去掉列表第一个城市
            removed.append(solNew[0])
            sol.remove(solNew[0])
        else:
            removed.append(solNew[dis.index(disSort[len(disSort) - i - 1]) + 1])
            '''
            len（disSort）-i-1得到排在最后面即距离最长的路段。len-1，len-2，...
            disSort[]得到最大值，dis.index得到最大值在距离列表中的索引
            solNew得到最大值路段所在起点的索引，+1删除路段终点
            如solNew = 【1,3,2】，dis = 【d13，d32，d21】=【9,7,8】
            disSort = 【7,8,9】，先移除最后面的9，再移除8，...
            9对应的dis索引为0，solnew对应索引0上的城市为1，移除1-3段，去掉3
            '''
            sol.remove(solNew[dis.index(disSort[len(disSort) - i - 1]) + 1])   #更新移除后的城市列表
    return removed

（5）定义第一个修复算子 —— 随机插入randomInsert( )

随机插入已经移除的3个城市。输入移除后的城市访问列表sol和移除列表removed，执行插入操作后访问列表sol变化。

def randomInsert(sol, removeList):    
    insertIndex = rd.sample(range(0, distmat.shape[0]), 3)    #随机生成插入的位置索引
    for i in range(len(insertIndex)):
        sol.insert(insertIndex[i], removeList[i])    #将移除列表中的元素逐个插入指定位置

（6）定义第二个修复算子 —— 贪婪插入greedyInsert( )

插入产生的距离成本最小的城市。输入移除后的城市访问列表sol和移除列表removed，执行插入操作后访问列表sol变化。

def greedyInsert(sol, removeList):   
    dis = float('inf')  #初始化距离
    insertIndex = -1   #初始化插入索引
    for i in range(len(removeList)):   #移除列表里有几个城市就循环几次
        for j in range(len(sol) + 1):   #对于可行解中的每一个索引位置
            solNew = copy.deepcopy(sol)
            solNew.insert(j, removeList[i])   #将移除列表中的元素插入新解列表索引j的位置中，生成新的城市访问顺序
            if disCal(solNew) < dis:   #插入后得到新解的距离是否<原解距离。solNew和当前解sol不一样，solNew只是作为中间过程插入哪里的判断条件
                dis = disCal(solNew)   #更新距离，将原解换成新解
                insertIndex = j    #确定移除列表中每一个城市插入的索引
        sol.insert(insertIndex, removeList[i])    #完成每一个城市的插入操作后，更新当前解
        dis = float('inf')   #完成每一个城市的插入操作后距离重新初始化

（7）定义破坏算子选择轮盘赌 —— selectAndUseDestroyOperator( )

输入摧毁算子权重destroyWeight和当前解currentSolution（城市访问顺序），输出破坏解后的城市列表sol、移除城市列表removedCities、和选择的摧毁算子序号destroyOperator。

里面需要调用过程（3）和（4）中的2个摧毁算子函数randomDestroy( )、max3Destroy( )。

def selectAndUseDestroyOperator(destroyWeight, currentSolution):   
    destroyOperator = -1    #算子初始值，除0/1外的数
    sol = copy.deepcopy(currentSolution)     #深拷贝,currentSolution之后的改变不影响sol
    destroyRoulette = np.array(destroyWeight).cumsum()  #轮盘赌,cumsum()把列表里之前数的和加到当前列，如a=[1,2,3,4]，comsum结果为[1,3,6,10]
    r = rd.uniform(0, max(destroyRoulette))    #随机生成【0，轮盘赌列表最大数】之间的浮点数
    for i in range(len(destroyWeight)):  #如wDestroyed = 【1,1】，destroyedRoulette = 【1,2】，判断生成的r在哪个范围内，【0,1】选序列为0的算子，【1,2】选序列为1的算子
        if destroyRoulette[i] >= r:   #判断是否在某个算子的对应范围内
            if i == 0:    #在序列为0的算子范围内，选择随机移除
                destroyOperator = i   
                removedCities = randomDestroy(sol)    #得到随机移除的城市列表
                destroyUseTimes[i] += 1     #随机移除算子使用次数累加
                break          #满足其中一个范围就跳出for循环
            elif i == 1:   #在序列为0的算子范围内，选择最大3段距离移除
                destroyOperator = i    #与上面类似
                removedCities = max3Destroy(sol)
                destroyUseTimes[i] += 1
                break
    return sol, removedCities, destroyOperator

（8）定义修复算子选择轮盘赌 —— selectAndUseRepairOperator( )

代码与（7）类似，不再赘述，只是输入变成修复算子权重repairWeight、摧毁后的城市列表destroyedSolution、移除列表removeList，输出变成修复后解destroyedSolution、修复算子选择序号repairOperator。

里面需要调用过程（5）和（6）中的2个修复算子函数randomInsert( )和greedyInsert( )

def selectAndUseRepairOperator(repairWeight,destroyedSolution,removeList):    
    repairOperator = -1
    repairRoulette = np.array(repairWeight).cumsum()
    r = rd.uniform(0, max(repairRoulette))
    for i in range(len(repairRoulette)):
        if repairRoulette[i] >= r:
            if i == 0:
                repairOperator = i
                randomInsert(destroyedSolution,removeList)
                repairUseTimes[i] += 1
                break
            elif i == 1:
                repairOperator = i
                greedyInsert(destroyedSolution,removeList)
                repairUseTimes[i] += 1
                break
    return destroyedSolution,repairOperator

（9）初始化算法运行数据

设定系数、迭代次数等参数。这个例子用了简单的按顺序依次访问作为初始解，也可以通过节约法之类的方法生成初始解。

T = 100   #模拟退火温度
a = 0.97  #降温速度
b = 0.5   #权重更新系数，控制权重变化速度

#用列表分别存储2个摧毁算子和2个修复算子的权重、次数、分数等信息
wDestroy = [1 for i in range(2)]    #摧毁算子的初始权重，[1,1]
wRepair = [1 for i in range(2)]     #修复算子的初始权重
destroyUseTimes = [0 for i in range(2)]    #摧毁初始次数，0
repairUseTimes = [0 for i in range(2)]     #修复初始次数
destroyScore = [1 for i in range(2)]       #摧毁算子初始得分，1
repairScore = [1 for i in range(2)]        #修复算子初始得分
solution = [i for i in range(distmat.shape[0])]    #初始解[0,1,2,3,..., 11]
bestSolution = copy.deepcopy(solution)             #最优解
iterx= 0    #初始迭代次数
iterMax = 100    #最大迭代次数100

（10）主程序

设置终止条件等，内嵌2个选择轮盘赌函数及模拟退火算法接受准则。

if __name__ == '__main__':
    while iterx < iterMax:    #终止条件：达到迭代次数，不满足终止条件就缓慢降低温度继续搜索
        while T > 10:   #终止温度
            destroyedSolution, remove, destroyOperatorIndex = selectAndUseDestroyOperator(wDestroy, solution)   
            #摧毁轮盘赌输入初始摧毁权重、初始解，得到摧毁后城市列表、移除列表、选择的摧毁算子序号
            newSolution, repairOperatorIndex = selectAndUseRepairOperator(wRepair, destroyedSolution, remove)   
            #修复轮盘赌输入初始修复权重、摧毁后城市列表、移除列表，得到新的城市列表、选择的修复算子序号

            if disCal(newSolution) <= disCal(solution):    #判断新解与旧解的距离
                solution = newSolution
                if disCal(solution) <= disCal(bestSolution):   #新解<最优解则替换成最优解
                    bestSolution = solution
                    destroyScore[destroyOperatorIndex] += 1.5
                    repairScore[repairOperatorIndex] += 1.5     #如果是最优解的话权重增加到1.5
                else:
                    destroyScore[destroyOperatorIndex] += 1.2
                    repairScore[repairOperatorIndex] += 1.2     #不是最优解仅仅好于旧解的话权重增加1.2
            else:
                if rd.random() < np.exp(- disCal(newSolution)/ T):     
                #应改成(disCal(newSolution) - disCal(solution)，使用模拟退火算法的接受准则在一定标准下接受劣解
                    solution = newSolution
                    destroyScore[destroyOperatorIndex] += 0.8     #满足接受准则的劣解，权重增加0.8
                    repairScore[repairOperatorIndex] += 0.8
                else:
                    destroyScore[destroyOperatorIndex] += 0.6   #不满足接受准则权重仅增加0.6
                    repairScore[repairOperatorIndex] += 0.6

            #更新权重，（1-b）应该放前面，这个例子里取b=0.5，无影响
            wDestroy[destroyOperatorIndex] = wDestroy[destroyOperatorIndex] * b
            + (1 - b) * (destroyScore[destroyOperatorIndex] / destroyUseTimes[destroyOperatorIndex])
            wRepair[repairOperatorIndex] = wRepair[repairOperatorIndex] * b
            + (1 - b) * (repairScore[repairOperatorIndex] / repairUseTimes[repairOperatorIndex])

            T = a * T   #温度指数下降
        iterx += 1         #完成一次降温过程算一次迭代
        T = 100      #一次迭代完毕后重新设置初始温度继续迭代

    print(bestSolution)   #达到终止条件后输出最佳城市访问顺序及距离
    print(disCal(bestSolution))

（11）完整代码及结果

完整代码如下：

# Adaptive Large Neighborhood Search
import numpy as np
import random as rd
import copy

distmat = np.array([[0,350,290,670,600,500,660,440,720,410,480,970],
                 [350,0,340,360,280,375,555,490,785,760,700,1100],
                 [290,340,0,580,410,630,795,680,1030,695,780,1300],
                 [670,360,580,0,260,380,610,805,870,1100,1000,1100],
                 [600,280,410,260,0,610,780,735,1030,1000,960,1300],
                 [500,375,630,380,610,0,160,645,500,950,815,950],
                 [660,555,795,610,780,160,0,495,345,820,680,830],
                 [440,490,680,805,735,645,495,0,350,435,300,625],
                 [720,785,1030,870,1030,500,345,350,0,475,320,485],
                 [410,760,695,1100,1000,950,820,435,475,0,265,745],
                 [480,700,780,1000,960,815,680,300,320,265,0,585],
                 [970,1100,1300,1100,1300,950,830,625,485,745,585,0]])

def disCal(path):             # calculate distance
    distance = 0
    for i in range(len(path) - 1):
        distance += distmat[path[i]][path[i + 1]]
    distance += distmat[path[-1]][path[0]]
    return distance

def selectAndUseDestroyOperator(destroyWeight,currentSolution):    # select and use destroy operators
    destroyOperator = -1
    sol = copy.deepcopy(currentSolution)
    destroyRoulette = np.array(destroyWeight).cumsum()
    r = rd.uniform(0, max(destroyRoulette))
    for i in range(len(destroyRoulette)):
        if destroyRoulette[i] >= r:
            if i == 0:
                destroyOperator = i
                removedCities = randomDestroy(sol)
                destroyUseTimes[i] += 1
                break
            elif i == 1:
                destroyOperator = i
                removedCities = max3Destroy(sol)
                destroyUseTimes[i] += 1
                break
    return sol,removedCities,destroyOperator

def selectAndUseRepairOperator(repairWeight,destroyedSolution,removeList):    # select and use repair operators
    repairOperator = -1
    repairRoulette = np.array(repairWeight).cumsum()
    r = rd.uniform(0, max(repairRoulette))
    for i in range(len(repairRoulette)):
        if repairRoulette[i] >= r:
            if i == 0:
                repairOperator = i
                randomInsert(destroyedSolution,removeList)
                repairUseTimes[i] += 1
                break
            elif i == 1:
                repairOperator = i
                greedyInsert(destroyedSolution,removeList)
                repairUseTimes[i] += 1
                break
    return destroyedSolution,repairOperator

def randomDestroy(sol):    # randomly remove 3 cities
    solNew = copy.deepcopy(sol)
    removed = []
    removeIndex = rd.sample(range(0, distmat.shape[0]), 3)
    for i in removeIndex:
        removed.append(solNew[i])
        sol.remove(solNew[i])
    return removed

def max3Destroy(sol):      # remove city with 3 longest segments
    solNew = copy.deepcopy(sol)
    removed = []
    dis = []
    for i in range(len(sol) - 1):
        dis.append(distmat[sol[i]][sol[i + 1]])
    dis.append(distmat[sol[-1]][sol[0]])
    disSort = copy.deepcopy(dis)
    disSort.sort()
    for i in range(3):
        if dis.index(disSort[len(disSort) - i - 1]) == len(dis) - 1:
            removed.append(solNew[0])
            sol.remove(solNew[0])
        else:
            removed.append(solNew[dis.index(disSort[len(disSort) - i - 1]) + 1])
            sol.remove(solNew[dis.index(disSort[len(disSort) - i - 1]) + 1])
    return removed

def randomInsert(sol,removeList):     # randomly insert 3 cities
    insertIndex = rd.sample(range(0, distmat.shape[0]), 3)
    for i in range(len(insertIndex)):
        sol.insert(insertIndex[i],removeList[i])

def greedyInsert(sol,removeList):     # greedy insertion
    dis = float("inf")
    insertIndex = -1
    for i in range(len(removeList)):
        for j in range(len(sol) + 1):
            solNew = copy.deepcopy(sol)
            solNew.insert(j,removeList[i])
            if disCal(solNew) < dis:
                dis = disCal(solNew)
                insertIndex = j
        sol.insert(insertIndex,removeList[i])
        dis = float("inf")

T = 100
a = 0.97
b = 0.5
wDestroy = [1 for i in range(2)]     # weights of the destroy operators
wRepair = [1 for i in range(2)]      # weights of the repair operators
destroyUseTimes = [0 for i in range(2)]     #The number of times the destroy operator has been used
repairUseTimes = [0 for i in range(2)]      #The number of times the repair operator has been used
destroyScore = [1 for i in range(2)]      # the score of destroy operators
repairScore = [1 for i in range(2)]       # the score of repair operators
solution = [i for i in range(distmat.shape[0])] # initial solution
bestSolution = copy.deepcopy(solution)  # best solution
iterx, iterxMax = 0, 100

if __name__ == '__main__':
    while iterx < iterxMax:       # while stop criteria not met
        while T > 10:
            destroyedSolution,remove,destroyOperatorIndex = selectAndUseDestroyOperator(wDestroy,solution)
            newSolution,repairOperatorIndex = selectAndUseRepairOperator(wRepair,destroyedSolution,remove)

            if disCal(newSolution) <= disCal(solution):
                solution = newSolution
                if disCal(newSolution) <= disCal(bestSolution):
                    bestSolution = newSolution
                    destroyScore[destroyOperatorIndex] += 1.5     # update the score of the operators
                    repairScore[repairOperatorIndex] += 1.5
                else:
                    destroyScore[destroyOperatorIndex] += 1.2
                    repairScore[repairOperatorIndex] += 1.2
            else:
                if rd.random() < np.exp(- disCal(newSolution)/ T):  # the simulated annealing acceptance criteria
                    solution = newSolution
                    destroyScore[destroyOperatorIndex] += 0.8
                    repairScore[repairOperatorIndex] += 0.8
                else:
                    destroyScore[destroyOperatorIndex] += 0.6
                    repairScore[repairOperatorIndex] += 0.6

            wDestroy[destroyOperatorIndex] = wDestroy[destroyOperatorIndex] * b + (1 - b) * \
                                             (destroyScore[destroyOperatorIndex] / destroyUseTimes[destroyOperatorIndex])
            wRepair[repairOperatorIndex] = wRepair[repairOperatorIndex] * b + (1 - b) * \
                                           (repairScore[repairOperatorIndex] / repairUseTimes[repairOperatorIndex])
            # update the weight of the operators

            T = a * T 
        iterx += 1
        T = 100

    print(bestSolution)
    print(disCal(bestSolution))

示例最后求得bestSolution = [8, 11, 7, 10, 9, 0, 2, 1, 4, 3, 5, 6]，总距离为4140。

4 总结

从上面可以看出自适应大领域搜索算法综合性还是挺强的，除了简单TSP及相关的距离优化问题，改进一下也能用在其他的优化问题中，或者与其他算法进行对比，感兴趣的朋友自己找论文看一下。理解有误的话还请大家多批评指正~

码农公寓