预测2021欧洲世界杯
世界杯预测结果
预测2021年欧洲世界杯,也是一道考试题目,因为出题老师是一个二十多年忠贞不渝的荷兰小球迷,还列出了一排福利:
- 荷兰进八强,请XXX
- 荷兰进四强,请XXXX
- 荷兰进二强,请XXXXX
- 荷兰进决赛,请XXXXXX
我不懂足球,甚至我一直听的都是河南(荷兰)……但是没关系,像算法就是在训练一种新的认知,一种信息时代的思维方式。
虽然它也是人思维的一部分,但和常人的思维方式完全不同,是伴随计算机出现的,结合人的逻辑、数学思维的思维。
训练好这种思维后,就是要把这种思维方式用到其他学科领域中去,可以带给人、产业的认知升级。 最需要考虑的一个问题就是,如何把那个领域的问题转化为信息或者数学问题,这也正是大部分计算机科学家做的事情。
现在我们预测2021年欧洲世界杯,荷兰VS捷克预测结果:
- 荷兰的胜率是 46.6%
- 打平概率是 31.3%
- 捷克获胜概率是 22.1%
荷兰赢的概率是46%,捷克赢的概率是22%,但今天我们知道最后是捷克赢了。
那是我预测错了么?这不是预测错了 —— 机器说了捷克有22%的可能性会赢,现在捷克赢了,也不过就是概率为22%的事件发生了而已。
你必须得能区分什么叫运气不好,什么叫决策错误。
我们都不能保证每一次预测都正确,但是可以保证决策系统的正确,我们要预测很多、很多把,所以,我们在乎的是一个能够以大概率预测对的科学决策系统,而不是某一把的输赢。
我们模型,总的预测结果:
-
八强 八场预测对了五场,预测成功率为62.5%。
-
四强 四场比赛预测成功了三场,预测成功率为 75%。
-
二强 二场比赛预测成功了一场,预测成功率为 50%。
-
决赛 预测英格兰胜出
P.S. 写在博客里的话,仅供个人复盘,不构成投资、赌博建议。
预测的原理是什么?
这就要回到最早期,原始人打完猎以后,把肉吃了,用骨头——上次行动的残余物作为一个介质,去获取天意。他们一般会把动物的骨头放在火上烤,骨头上就会出现裂纹。
至于裂纹到底意味着什么,只有部落的权威知道——这个权威既是部落的政治首领,也是部落的教主,他看见裂纹以后,会告诉其他人:“哦,今天应该朝东南方向打猎,会打到不少猎物”。
在中国,有两种方法,占和卜。卜是象形字,就是一个个裂纹;占比较复杂,是把一种特殊的草——蓍草,割下来晒干,剪成整齐的小棍,用来作为一种计算的工具,就像算盘是一种计算工具一样。
通过占卜的复杂操作,我们可以得出一组数据,这些数据由两种数组成:阳数和阴数,也可以简化成1和0。由1和0组成的6个数位的数字,就叫一卦。
周易算卦原理
我在算命先生身上学了一点点周易。
其实相对于算命,我更喜欢拉着他聊天,请他和我说说各种神异之事,因为他有另一套世界观,和另外一套世界运转的规律,也能自圆其说,让生活变得丰富多彩。
最喜欢他的有得必有失,有失必有得。
总体上来说,算命的人比算命这件事更有趣。
话说回来,无论是网上的、开店的、摆摊的、电脑程序的,各种打着《周易》旗号算卦的,其实绝大多数都不是《周易》正宗,而是京房纳甲、子平八字之类的东西,甚至就是一堆“以其昏昏使人昭昭”的大杂烩,反正只要能搬出一串可怕的专业术语把人吓到就好。
只因为《周易》招牌最老,字号最硬,所以谁都想借《周易》的名号。
我们可以有一个很简单的辨别方法:“大师”只要让你报出生日期之类的个人信息,我们就能判定这不正宗。
因为算卦的基本原则是对具体的事情算卦,而不是泛泛地算一个人的未来命运。
那么,究竟什么才是正宗的《周易》算法呢?
先想好要预测什么事,而后用五十根蓍草来做运算。蓍草是一种很特殊的植物,找不到的话不妨就拿五十个围棋子。
经过十八轮演算就可以算出一卦。为什么说“女大十八变”而不是“十七变”、“十九变”,源头就在这里。只有经过十八变,这才完整了,成熟了,发生质变了。
算出一卦之后,再从本卦求出变卦,对照《周易》里的卦爻辞就可以占卜吉凶了。
翻开周易,一共六十四卦,每一卦都有卦辞和爻辞。第一卦是乾卦,内容如下:
- 乾:元亨利贞。
- 初九:潜龙勿用。
- 九二:见龙在田,利见大人。
- 九三:君子终日乾乾,夕惕若厉无咎。
- 九四:或跃在渊,无咎。
- 九五:飞龙在天,利见大人。
- 上九:亢龙有悔。
- 用九:见群龙无首,吉。
从头看起:“乾”是卦名,跟在卦名后面的“元亨利贞”就是卦辞。
如果我们遇到需要以乾卦卦辞定吉凶的情况,那么“元亨利贞”就是我们的答案(凶或者吉),“元亨利贞”用现在的话来说,就是大吉大利~
一卦由六爻构成,每一爻还会有自己的爻辞,也就是解释吉凶祸福的语句。
乾卦六爻,从下往上依次是初九、九二、九三、九四、九五、上九。
以“初九”例,“初”用作定位,表示这个爻是卦里边的第一爻;“九”用作定性,表示这一爻是阳爻。
再看“九二”,“九”是定性,表示阳爻;“二”是定位,表示这是卦里的第二爻。
以此类推,“上九”,“上”是定位,表示这一爻是卦里的第六爻,位置在最上边;“九”是定性,表示这一爻是阳爻。
在定性规则里,“九”表示阳,“六”表示阴。
算命可以解决的问题
先说说不能解决的问题:
⒈问题不能太泛泛:算卦的基本原则是对具体的事情算卦,而不是泛泛地算一个人的未来命运。所以说,凡是让你报出出生日期或什么私人信息,说你一生注定大富大贵,一定是骗子来的。
⒉问题不能太具体:我们常会看到质疑算卦大师的人这么说:“你要是真会算,就把下期彩票的中奖号码算出来!”,这种质疑,其实也是不懂《周易》的表现,《周易》本来就处理不来这种预测。
比较合乎规范的提问应该是这样的:“我打算去买彩票,这一去到底是吉是凶,拜托您老人家给我算上一卦!”
如果演算的最终结果是“潜龙勿用”,意思就是:最好别去,就算你真是一条龙,这种时候你也应该低头趴着。
答案仅此而已吗,没有更细节的内容吗?
是的,《周易》只能预测到这种程度,那种预测出很多细节的传说要么是对《周易》的神化,要么出自算卦大师的个人发挥。
好吧,我们倒也可以接受这种程度的预测,但它到底准不准呢?
我可以很负责任地说:准,百分之百的准!
不是我迷信,而是因为这是一个不可证伪的结论。
也许你不服气,那么,让我们设想一种情况:虽然你拿到了“潜龙勿用”的爻辞,但你不在乎一点小钱,还是去买了彩票,竟然还中了!
这是不是就能证明《周易》不可靠呢?——当然不能,《周易》是可靠的,之所以没有应验,只能说明给你算卦的那个人学艺不精。
那如果给你算卦的人是公认的易学第一高手呢?那依然不能证伪什么,道理很简单:塞翁失马焉知非福,塞翁得马焉知非祸,彩票的小胜利当中隐伏着大的灾祸,多少中了彩票的人众叛亲离,家破人亡,盲目投资,倾家荡产,安稳已是万幸,之所以让你“潜龙勿用”,不是说你中不到彩票。
好吧,再追加一个条件:如果你中彩票后,一辈子顺风顺水,最后得了善终,是不是总可以盖棺论定了呢?
也不可以,灾难难道一定应在你的头上吗,难道就不能应在你子孙头上吗?
因为在古代思维里,家族属性重于个人属性,不像我们今天这样强调个人。这是古代社会的一种普世现象,从家族意识到个体意识的转变发生得相当晚近。
无论追加怎样的条件,都无法证伪——用来解读吉凶祸福的卦爻辞晦涩难懂,很难从文字里读出准确的涵义。
其实无论是怎样的命,算出来总有好的部分,也总有坏的部分。人性又从来贪图圆满,好的部分会欣然领受,觉得理所应当。但是对于坏的部分却根本放不下,就会请命师改命。
无论是哪一种,结局只会有两个,一种是有效,一种是无效。
-
如果是有效,那就会发展到要求长期化,固定化。
-
如果是无效,那就更糟糕了,人心会认为算得准,但是解法不灵,因此要去别处求取解法。于是,没完没了。本来没什么事,对付着也都能活。但是一旦动心起念,那就会在这条路上越走越远。到处找大师算命,感觉是一定要算出满意的一命来才能停止,但这又怎么可能有停止的时候?不断的向外求取,最后,只会让自己的心不安宁。
有得必有失,你要一样东西,必然会失去另一样。命里有时终须有,命里无时莫强求。
《周易》算卦最精彩是《左传》卦例:史苏预测韩原之战,史苏不但把韩原之战的结局预测准了,甚至连战争细节——车抛锚了——都讲到了,但史苏的神奇还不止于此,接下来他还准确预测出了韩原之战的后续事件,时间、地点、人物清清楚楚,但最后,晋献公最追悔的也是这副卦。
善易者不卜
善易者不卜,意思是一个精通易理的人完全可以未卜先知,也就没必要靠占卜来预测未来了。
因为《周易》阐释了许多诸如“物极必反”、“阴阳相济”之类的物理与人生的基本规律,只要你掌握了这些规律,自然拥有了一定的预测能力,所谓“君子见一叶落而知秋,尝一勺而知鼎镬”。
如果你深谙人情世故,又擅于捕捉微表情的话,能够仔细感知事物的发展变化,做到未雨绸缪,不懂易理也可以做出同样的预测。
人生的问题,我觉得有些是能想明白的,有些是不可能想明白的。
-
在价值观的问题上是比较容易想明白的,人生中什么东西重要,什么东西不重要,对我来说已经是很清楚了,我觉得更加重要的是让自己的精神愉快,让自己的精神丰富,让自己变得优秀,这个非常重要。
-
有些东西是没法想明白的,比如说生死问题,很多大师都没有想明白,对于这些想不明白的问题,我采取的态度就是说不要和自己较劲了,这不是自己能解决的问题,这是神的问题,让神来去回答吧。
人工智能预测原理
巫术也好,周易也好,智能技术也好,不管有多大的差别,它们的相通之处就是获取认知,把隐藏在现象背后的秘密挖掘出来。
大体来说,他们都是先确立一种算法,而后收集数据,并通过这些数据得出对未来的预测;都是通过对现在的状况、未来的趋势和走向,作出相应的决策。
今天的人工智能,也可以说是一种基于最前沿科技的特殊“巫术”,它的功能是预测未来,手段是确立算法、收集数据。
只是在《周易》的原初算法里,算法其实不重要,工具才重要,这个工具就是一种叫做蓍草的神奇植物。
之所以工具比算法重要,因为占卜工具扮演着灵媒的角色,吉凶祸福并不是某一套算法算出来的,而是灵媒帮我们向祖先神灵问出来的。
寿命决定灵性:人越老越精,物越老越灵,所以蓍草和乌龟可以充当灵媒。
人工智能和《周易》算卦又不同,人工智能准不准,学习数据说的算!
人的认知的形成也是如此,中医里的望闻问切都是数据的收集,当然,有经验的老中医存储的数据不仅仅只是通过望闻问切而获取的单个数据,而是他头脑当中存储了过往生活中的大量数据,经过我们不知道的复杂计算,得出一系列判断,而后给出一个处方。
但要找到所有球队的详细数据真是件头疼的事情,毕竟球队那么多。
所以只能在有限的数据下,完成分析。首先从Kaggle下载各个球队历年的比赛数据。
第一步是用一个数学模型代替真实世界。
比如我要预测一场足球比赛,我的预测模型可以是双方球员的能力值决定比赛结果。我只考虑了射门、传球、防守各项能力的对比,但是像裁判执法是否公正,天气之类的因素我就忽略了。任何模型总要忽略一些东西。
第二步,选择算法。
比如蒙特卡罗模拟,是对你的模型进行若干次的模拟。我的模型里包括22个 AI 球员,他们各自代表一名真实球员的能力值。我可以据此用计算机模拟10万场比赛,看看有多少场是主队赢了,有多少场是客队赢了,算出概率,公布预测结果。
比如逻辑回归,我们有两支球队的所有出场球员信息、历史交锋成绩、比赛时间、主客场、裁判和天气等信息,根据这些信息预测球队的输赢。假设比赛结果记为y,赢球标记为1,打平标记为0,输球标记为-1,算出概率,公布预测结果。
预测模型:逻辑回归
思路是这样的:先对两组数据集进行探索性分析,找出跟预测有关联的特征,进行处理数据,而后用一个机器学习模型进行训练,最后将模型配置到数据集上。
# 导入需要的包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib.ticker as ticker
import matplotlib.ticker as plticker
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# 加载数据
data = pd.read_csv('datasets/soccer_history_data.csv')
# 查看数据
data.head()
# 数据预处理:进球数差异、确定比赛输出(输、平、赢)
win = []
n = len(data['home_team'])
for x in range(n): # 从 0 开始到 n-1
if data['home_score'][x] > data['away_score'][x]:
win.append(data['home_team'][x]) # 赢
elif data['home_score'][x] < data['away_score'][x]:
win.append(data['away_team'][x]) # 输
else:
win.append('平')
data['winning_team'] = win
data['goal_difference'] = np.absolute( data['home_score'] - data['away_score'] ) # 净胜球数 = 主场得分 - 客场得分
data.head()
# 重点看荷兰(Netherlands