数据分析告诉你月薪多少才“配”坐高铁

快放假了,学姐又要去看望她的遍布祖国各地的男友们了。


没错,每当重要的假期来临,学姐就会开始认真地研究买火车票的问题:到底怎么规划行程,怎么控制预算,假如男友们坚持要一起坐车,怎么让他们彼此都无法发现对方的存在。诸如此类的问题。不用说,这出谋划策的任务又落在我的身上了。


果不其然,学姐又问了:哎,短短一个月,要去看那么多人,火车票就是一笔大开销。你说我坐动车还是高铁呢?我这么点收入应该坐哪种火车比较划算呢?


划不划算的话,对于任何一班列车而言,其实都需要考虑三个重要属性:

1,列车区段;

2,运行时间;

3,车票价格。


在这三个要素中,运行时间和票价之间的关系十分明显不用多说:对于在同一区段里运行的不同车次,运行时间越短则票价越高。但对于学姐这样要游历全国的人来说,需要研究的就不仅仅是某一趟车了,而是全国多个区段的多种车次。那么,我们就不得不先研究以下问题:


在全国尺度上来看,列车区段与票价或运行时间之间是什么关系呢?


我们以2015年6月某日的全国列车时刻表为例吧(数据是上个月某天心血来潮从网上抓下来的是的我就是这么随性)。该表共计约有24000条区段信息(站到站信息),包括了站点、时刻、座位等级、票价等等。一共覆盖了全国235个热点城市和500个火车站,画成图的话大概长这样:


数据分析告诉你月薪多少才“配”坐高铁


好的,看着上面这张图,第一个问题来了:在全国铁路网中,哪些区段的时间更昂贵呢?


为了衡量“昂贵度”,我们可以把任何一段线路上最高列车票价(Pmax)和列车最短运行时间(tmin)的比值(Pmax/tmin)作为参考。换句话说,我们可以简单地认为:单位时间内支付的票价(时价比)越高,说明该区段越昂贵。


在这个思路下,我们选出了全国所有区段上跑得最快的车次,然后计算出这些车次的时价比,再把其数值落在空间上,画出图来大概长这样(由于区段间互有叠加,为了看得更清楚所以采用了站到站的直线显示方法,故而跟上图略有不同):


数据分析告诉你月薪多少才“配”坐高铁


颜色越红,说明这两站点之间的区段越昂贵,颜色越蓝则反之。较为昂贵的区段大量地分布在京广、京沪、哈大这三条高铁线路上。其中最贵的前五名区段则如下表所示:


数据分析告诉你月薪多少才“配”坐高铁


可以看到,京广线上价格颇高,而最贵的深广段已经达到了每小时160块钱的高价。


在了解完最贵的区段后,第二个问题又来了;在全国铁路网中,哪些区段的时间更便宜呢?


同样的道理,我们可以把全国所有区段上最低列车票价(Pmin)和列车最长运行时间(tmax)的比值(Pmin/tmax)作为区段“便宜度”的参考值。换句话说,我们可以简单地认为:单位时间内支付的票价(时价比)越低,说明该区段越便宜。


在这个思路下,我们选出各区段上跑的最慢的车次,计算出这些车次的时价比,并落在空间线路上,大概长这样:


数据分析告诉你月薪多少才“配”坐高铁


颜色越绿,区段越便宜,颜色越红,则反之。从图中可以看到,很明显地,中西部地区的便宜区段要远远多于东部沿海地区。其中最便宜的区段的前五名则如下表所示:


数据分析告诉你月薪多少才“配”坐高铁


没想到的是,最便宜的区段竟然并不在偏远地区,而是帝都附近的廊坊北京段。我又查阅了一下车次,发现使得这个区段最便宜的那班车,是廊坊北站到北京站的6452次普通快车,票价只要4块钱,运行3小时,算下来每小时才1块多钱。廊坊果然是个好地方,只要一个驴火的钱就能送你去首都。


通过以上两个问题的分析,我们可以看到,在全国尺度上不同铁路区段的时价比大相径庭。这样的话,不同类型的列车之间就很难有直接的可比性了。


于是,我弱弱地问:学姐,你男友实在太多了,而全国性的研究又十分困难。为了可操作性,你要不要删掉一些铁路支线上的男友啊。学姐翻了翻手机通讯录,羞涩地说:好吧,你说的也有道理。不如我就先去看住在昆山、苏州、无锡、常州、镇江、南京、宿迁、徐州、泰安、济南、沧州、北京的男友们吧。其他的让他们等下次假期再说。


学姐果然温柔体贴,怪不得整个京沪线上全是男朋友。但这样也好,京沪线区段设定了,接下来需要分析车次了。查阅一下抓取到的数据,6月某日共计有92班京沪列车(京-沪、沪-京各46班车),其具体情况如下表所示:


数据分析告诉你月薪多少才“配”坐高铁


然后,计算出每辆列车的时价比,得到下图:


数据分析告诉你月薪多少才“配”坐高铁


在上图中,横轴代表运行时间长度、纵轴代表票价高低,气泡大小代表班车数量。


可以看到,在京沪线上,大部分列车的运营时间都保持在6小时左右,而时价比最高的京沪列车编号则分别为G1/G2/G3/G4(看编号就觉得碉堡了),达到了115元/小时。


也就是说,假如学姐要坐这四班车去看男友们,那么每个小时要支付115块钱。


这是什么概念呢?


我们来做个比较。根据上海市统计年鉴,2013年上海市的平均工资62203元/年。按每年工作12个月、每月工作22天、每天工作8小时计算的话,平均时薪大约是29.5元/小时。嗯,没错,这大概是高铁时价比(115元)的四分之一。


因此,理论上来看,坐高铁每小时所花掉的钱,是远远大于上海大部分人的时薪收入的。那么,反过来看,要月收入多少才能坐高铁呢?


答案是:当月薪到2万时,你的时间就和高铁一样值钱了。


先别着急跟自己比较,我们不妨再往深处挖掘一下。


我们再进一步整理统计年鉴中2013年北京和上海的数据,根据行业大类计算出每个行业的时薪,然后叠加在京沪列车的时价比上,可以得到这张图:


数据分析告诉你月薪多少才“配”坐高铁


可以看到:

1 上海市的金融业平均时薪约84元,勉强赶得上最便宜的高铁;

2 而北京的金融业平均时薪约111元,幸运地可以赶上较快的高铁,但也只是二等座而已。

3 而其他大多数行业的时薪都没赶上高铁,只在动车的价格附近徘徊:

4 至于从事餐饮业、居民服务业和在上海务农的小伙伴,不好意思要不然你们还是考虑普通列车试试看?


听完这个结论,学姐整个人陷入了久久的沉默之中。我感觉她可能再也不想见自己的男友们了。


我看着她悲怆的眼神,忍不住说:学姐,你先不要绝望。实际上,我还有一个好办法:让你即便时薪跑不过高铁,但也能相对划算地乘坐。


学姐赶忙抓住我的手,问:什么办法?


我说:心诚则灵。


学姐问:什么意思?


我说:意思是,你必须下定决心不顾一切地去看你的男友们才行。


学姐问:这有什么不一样吗?


我说:当然不一样。学姐,假如你已经决定了要坐火车去某地看你的男友们,排除万难一定要去,那么无论如何你都会买一张票。在这样一种新的设定下,你需要参考的已经不再是某一趟列车的时价比,而应当是你最终所选择的那趟列车的时价和你所能选择的最低时价之间的差值。


换句话说,当你下定决心一定要去之后,你就不需要再考虑这趟旅途每小时付多少钱的问题,而需要考虑的是:这趟旅行你会省多少时间,而为了省这些时间,你要多付多少钱。


而这个下定了决心之后的公式大概长这样:dP/dt=(Pmax-Pmin)/(tmax-tmin)


我们用这个新公式计算一下结果吧,为了缩短在京沪线路上的时间,你需要额外支付多少钱呢?


看图便知:


数据分析告诉你月薪多少才“配”坐高铁


从图中可以看到,京沪列车的时间价格并不是连续变化的,而是有4个跳跃点。每一个点就是一次车型等级的变化:

1 假如你乘坐历时22小时的、最慢的那班车,你只需要支付156.5元的硬座票价;

2 如果你想把时间缩短7个小时,需要额外再支付21元;

3 想要缩短10.5个小时,需再支付131.5元;

4 想要缩短12个小时,再支付99元;

5 想缩短16个小时甚至更多,再支付145元。


156.5+21+131.5+99+145=553元,没错,这就是高铁二等座的价格。


然后我们再把跳跃的价格平摊到每一个小时,我们就可以得到京沪列车的价格增益曲线,如下图所示。


数据分析告诉你月薪多少才“配”坐高铁


虽然图看起来很抽象,但可以清楚地看到,纵轴标示的数量级顿时下降到了30元以内。是的,如果学姐选择了乘坐运行时间约5小时的那班高铁(上图中最左端的点),那么与普快相比,可以节省17个小时,而你为这17个小时多支付了多少钱呢?


答案是:396.5元。即每个小时价值23元。换算到月薪大约4050元。


好吧,学姐,假如你已经下定了排除万难不顾一切地去见你的男友们的决心,那么究竟要不要选择坐高铁,可能只剩下最后一个问题了:


你的月薪超过4050元了吗?




写在后面的话。


学姐薪水涉及个人隐私,我就不随意透露了,而至于学姐最后是否买了高铁票去见到了她的男友们呢?我也不得而知。


但无论如何,增加一个彩蛋吧。我们根据统计年鉴上所记录的各个行业平均收入,非常贴心地列出了推荐乘坐的列车类型和班次。如下表所示:


数据分析告诉你月薪多少才“配”坐高铁


总而言之,请珍惜你身边月薪低于4050元的小伙伴们吧,没事多带他们坐高铁兜兜风。要知道,这可是(前)铁道部给你定出的一条“配”坐高铁的金线。


*注:

1,本文所有数据均来自于互联网开源数据或公开数据,由城市数据团(MDT)提供。但需要注意的是,本文仅从时间成本的角度上讨论了乘坐高铁的选择问题,仅供参考。现实世界中,人们总会考虑更多因素,无论如何,个人选择的事,还是跟随自己的内心吧。


添加老师 微信 cdagood领取价值2999元数据分析资料!!

数据分析告诉你月薪多少才“配”坐高铁

上一篇:数据分析:让Python告诉你约会是否可以成功


下一篇:你还在学Java?学python才是有道!图解更详细