合肥市出行地铁路径规划——基于Dijkstra算法

合肥市出行地铁路径规划——基于Dijkstra算法

1. 引言
2. 导入相应的模块
3. 申请高德地图的API
4. 获取合肥地铁数据
5. 计算合肥各地铁站点之间的距离
6.寻找最近的地铁站
7. 运用Dijkstra算法进行路径规划
8. 封装打包
9. 是骡子是马拉出来遛遛
  1. 引言

本此博文的完成是数据+算法,数据部分是基于合肥本地宝和高德地图提供的个人开发版api;算法是基于Dijkstra。(所使用的工具是Python)
2. 导入相应的模块

各读者可以根据自己PC运行报错信息,自行增加或删除相应模块。

import itertools
import xlrd
from geopy.distance import geodesic
import xlwt
import requests
from bs4 import BeautifulSoup
import pandas as pd
import json
import os
from tqdm import tqdm
from collections import defaultdict
import pickle

1
2
3
4
5
6
7
8
9
10
11
12
  1. 申请高德地图的API

申请地址为:申请地址
申请步骤:
免费注册(自行完成注册)
进入控制台
进入我的应用
创建新应用(笔者创建信息如下,安全起见,给keynum打码(这里的key对于能不能成功起着决定性作用)。
在这里插入图片描述
这个时候,就获得了高德题图的key,为后面顺利接入API奠定了基础。
4. 获取合肥地铁数据

为了获得合肥各个地铁的地铁站信息,通过爬虫爬取合肥各个地铁站点的信息,以及高德地图提供的经纬度信息,并存储到xls文件中(之所以存储到xls文件中,是因为原因是最近xlrd更新到了2.0.1版本,只支持.xls文件,所以pd.read_excel(‘xxx.xlsx’)会报错。)。下图为合肥市最新的地铁线路图。
在这里插入图片描述
图1 合肥市地铁线路图(来源:合肥本地宝)
代码如下

def spyder():
#获得合肥的地铁信息
print(‘正在爬取合肥地铁信息…’)
url=‘http://hf.bendibao.com/ditie/linemap.shtml’
user_agent=‘Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; en) Presto/2.8.131 Version/11.11’
headers = {‘User-Agent’: user_agent}
r = requests.get(url, headers=headers)
r.encoding = r.apparent_encoding
soup = BeautifulSoup(r.text, ‘lxml’)
all_info = soup.find_all(‘div’, class_=‘line-list’)
df=pd.DataFrame(columns=[‘name’,‘site’])
for info in tqdm(all_info):
title=info.find_all(‘div’,class_=‘wrap’)[0].get_text().split()[0].replace(‘线路图’,’’)
station_all=info.find_all(‘a’,class_=‘link’)
for station in station_all:
station_name=station.get_text()
longitude,latitude=get_location(station_name,‘合肥’)
temp={‘name’:station_name,‘site’:title,‘longitude’:longitude,‘latitude’:latitude}
df =df.append(temp,ignore_index=True)
df.to_excel(’./hefei_subway.xls’,index=False)

def get_location(keyword,city):
#获得经纬度信息
user_agent=‘Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50’
headers = {‘User-Agent’: user_agent}
url=‘http://restapi.amap.com/v3/place/text?key=’+keynum+’&keywords=’+keyword+’&types=&city=’+city+’&children=1&offset=1&page=1&extensions=all’
data = requests.get(url, headers=headers)
data.encoding=‘utf-8’
data=json.loads(data.text)
result=data[‘pois’][0][‘location’].split(’,’)
return result[0],result[1]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
  1. 计算合肥各地铁站点之间的距离

高德地图api提供了计算距离的接口,我们来构造计算距离的函数,然后输入输入经度和纬度就可以获得距离。
代码如下:

def compute_distance(longitude1,latitude1,longitude2,latitude2):
#计算两点之间的距离
user_agent=‘Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50’
headers = {‘User-Agent’: user_agent}
url=‘http://restapi.amap.com/v3/distance?key=’+keynum+’&origins=’+str(longitude1)+’,’+str(latitude1)+’&destination=’+str(longitude2)+’,’+str(latitude2)+’&type=1’
data=requests.get(url,headers=headers)
data.encoding=‘utf-8’
data=json.loads(data.text)
result=data[‘results’][0][‘distance’]
return result

1
2
3
4
5
6
7
8
9
10

pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。pickle模块只能在python中使用,python中几乎所有的数据类型(列表,字典,集合,类等)都可以用pickle来序列化,pickle序列化后的数据,可读性差,人一般无法识别。但是,爬取信息比较耗时,这里将制作好的图网络保存为pickle文件方便以后使用(无需给人看,电脑认识就行)。
6.寻找最近的地铁站

我们要去找距离最近的地铁站首先是获得位置的坐标;然后,将当前的坐标遍历所有地铁站找到最近的地铁站。(代码过多,这里就不贴了,如有需要请留言或者Email: mr.zhan9902@foxmail.com)
7. 运用Dijkstra算法进行路径规划

关于Dijkstra算法的介绍网上有很多资料,这里就不赘述,部分代码如下:

#找到最短的路径
def find_shortest_path(start,end,parents):
node=end
shortest_path=[end]
#最终的根节点为start
while parents[node] !=start:
shortest_path.append(parents[node])
node=parents[node]
shortest_path.append(start)
return shortest_path
#计算图中从start到end的最短路径
def dijkstra(start,end,graph,costs,processed,parents):
#查询到目前开销最小的节点
node=find_lowest_cost_node(costs,processed)
#使用找到的开销最小节点,计算它的邻居是否可以通过它进行更新
#如果所有的节点都在processed里面就结束
while node is not None:
#获取节点的cost
cost=costs[node] #cost 是从node 到start的距离
#获取节点的邻居
neighbors=graph[node]
#遍历所有的邻居,看是否可以通过它进行更新
for neighbor in neighbors.keys():
#计算邻居到当前节点+当前节点的开销
new_cost=cost+float(neighbors[neighbor])
if neighbor not in costs or new_cost<costs[neighbor]:
costs[neighbor]=new_cost
#经过node到邻居的节点,cost最少
parents[neighbor]=node
#将当前节点标记为已处理
processed.append(node)
#下一步继续找U中最短距离的节点 costs=U,processed=S
node=find_lowest_cost_node(costs,processed)

#循环完成 说明所有节点已经处理完
shortest_path=find_shortest_path(start,end,parents)
shortest_path.reverse()
return shortest_path

def subway_line(start,end):
file=open(‘graph.pkl’,‘rb’)
graph=pickle.load(file)
#创建点之间的距离
#现在我们有了各个地铁站之间的距离存储在graph
#创建节点的开销表,cost是指从start到该节点的距离
costs={}
parents={}
parents[end]=None
for node in graph[start].keys():
costs[node]=float(graph[start][node])
parents[node]=start
#终点到起始点距离为无穷大
costs[end]=float(‘inf’)
#记录处理过的节点list
processed=[]
shortest_path=dijkstra(start,end,graph,costs,processed,parents)
return shortest_path

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
  1. 封装打包

建立main文件封装所有函数。

def main(site1,site2):
if not os.path.exists(’./subway.xls’):
spyder()
if not os.path.exists(’./graph.pkl’):
get_graph()
longitude1,latitude1=get_location(site1,‘合肥’)
longitude2,latitude2=get_location(site2,‘合肥’)
data=pd.read_excel(’./hefei_subway.xls’)
#求最近的地铁站
start=get_nearest_subway(data,longitude1,latitude1)
end=get_nearest_subway(data,longitude2,latitude2)
shortest_path=subway_line(start,end)
if site1 !=start:
shortest_path.insert(0,site1)
if site2 !=end:
shortest_path.append(site2)
print(‘根据Dijkstra算法得出的出行路线为:\n’,’->\n’.join(shortest_path))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
  1. 是骡子是马拉出来遛遛

比如,我现在处于合肥工业大学翡翠湖校区,要去合肥南站,我的路线该如何规划?(假设只乘坐地铁)
注意:下面的代码中,keynum处需要输入高德地图分配的KEY号码。
main文件的参数不需要与官方地点名称相同,比如,也可以输成:合工大翡翠湖区等等。

if name == ‘main’:
global keynum
keynum=‘安全起见,这里就不输入我的key了哈哈’ #输入自己的key
main(‘合肥工业大学翡翠湖校区’,‘合肥南站’)

1
2
3
4

运行结果为:
在这里插入图片描述
即出行路线为:
合肥工业大学翡翠湖校区->工大翡翠湖校区->大学城北->繁华大道->安医大二附院->省博物院->图书馆->合肥大剧院->市政务中心->洪岗->国防科技大学->西七里塘->五里墩->三里庵->安农大->三孝口->四牌楼->大东门->包公园->大南区->朱岗站->秋浦河路->葛大店->望湖城->合肥南站
然后,通过百度地图搜索结果如下图所示,与本规划结果竟然一致哈哈(弄不好百度地图用的也是Dijkstra哦,猜测而已,毕竟不能阻止其他算法也得出同样的结果呀哈哈)。
在这里插入图片描述
本文参考了很多资料,非常感谢各位作者的贡献(如有侵权,请联系mr.zhan9902@foxmail.com);欢迎各位看官一起交流、讨论,共同学习、共同进步。

上一篇:黄昏-dijkstra


下一篇:啊哈算法中的Dijkstra最短路算法(好理解!!!)