上上、小智整理编辑,部分资料来源自互联网
转载请注明出处
昨天晚上11点,2018年世界杯的首场赛事在东道主俄罗斯和沙特阿拉伯之间展开,卢日尼基体育场最终留下了5:0的成绩,普京的抬手三连摊也成功圈了一波粉丝,体育竞赛业又迎来了高潮期,各路人马对于谁会问鼎冠军宝座的猜测也已经纷纷展开。据说围绕世界杯冠军花落谁家的竞猜已经使全球博彩业的总盘到达了100亿美金。在竞赛输赢这个事情上,仅仅活了两岁半的章鱼保罗曾创造了神话,和往届世界杯相同的是,今天各国的动物们又开始了竞猜,跟往年不同的是,人工智能今年也加入了对冠军预测的大潮。
2018年世界杯,究竟会花落谁家呢,目前有如下大热门被各种机构用人工智能预测出来了,下面带大家来看看都有哪几家~
2018
德国
加里·莱因克尔的语录“足球就是一种由英国人发明,经过场上22个人激烈拼抢,苦战90分钟后,最后由德国人获胜的运动!”
俄罗斯彼尔姆国立研究大学的一名物理系大四学生维克多•扎科派洛,建立了一个能预测2018年世界杯冠军的人工智能神经网络。
此前,扎科派洛进行了大量的研究,得出了对比赛结果产生最重要影响的几条标准,然后将数据输入网络。消息称:“神经网络综合各项参数进行分析计算后得出结论称,世界杯前三名将是德国队、巴西队和阿根廷队。”
这个神经网络还预测,俄罗斯队将在32支队伍中排名27。也就是说,在它的预测中,俄罗斯队不能在小组赛中出线。
彼尔姆国立研究大学称,这项预测的准确度超过80%。
神经网络的制造者扎科派洛强调,预测足球赛冠军是一项艰巨任务,特别是有两支力量相当的队伍的时候。扎科派洛认为,天气、裁判、球员心情、球场状态、球员身体状况、伤势和在比赛中的碰撞都会影响比赛结果。因此,他在研究中使用了2006年、2010年和2014年世界杯的数据资料。
除了俄罗斯的大学生外,早在5月18日瑞银集团也利用人工智能对今年俄罗斯世界杯进行预测,称德国队夺冠概率最高。
德国决赛战胜阿根廷 赢得2014巴西世界杯冠军
瑞银的全球财富管理部门的投资总监办公室使用了人工智能工具对世界杯进行了预测,结果显示,德国队夺冠概率高达24%,紧随其后的巴西和西班牙队的夺冠概率分别是19.8%和16.1%。再往后依次是英格兰、法国和比利时队,夺冠概率分别是8.5%、7.3%和5.3%。
瑞银还预测,东道主俄罗斯队将小组出线、闯入十六强,但随后输给西班牙队或葡萄牙队而被淘汰。
地球是圆的,足球也是圆的,虽然目前来看,双方的人工智能都预测德国会夺冠,但对于东道主俄罗斯的分析却大不相同,
2018
西班牙
德国多特蒙德工业大学统计学系的助理教授,Anreas Groll 所带领的团队也参与了有关奖杯归属的预测
在揭露这个团队的预测结果之前,首先要向大家介绍一下一种近几年来在机器学习领域开始受欢迎的统计方法——随机决策森林 (random decision forests),简称随机森林。随机森林是一种融合了统计学和机器学习的方法。它常被人拿来和决策树,另一种更为人所熟知的统计方法比较。
决策树和随机森林的区别很好理解。就拿世界杯正赛来说,一支球队最终夺冠的几率并不是瞎猜出来的。大家都知道,球队夺冠的路径是从每组四支球队的小组赛前两名出线,然后经历八分之一决赛、四分之一决赛、半决赛、总决赛才能夺冠。
如果你找一个常见的决策树系统来判断,它在 32 进 16、16 进 8、8 进 4、4 进 2 和决赛的每个阶段都进行大量的计算,最后可能得到一个十分怪异的结果,比如中国队夺冠之类的……
因为它在当前阶段做出的决策,都高度依赖上一阶段的决策。这就好比一棵树,如果从根部就长歪了,再怎么往上长,也只能是在歪的上面不断进行修正,还有可能更歪,最后长成一棵扭曲的,现实中根本不可能存在的树……
至于随机森林,名字已经很直白了:简单来说,随机森林就是一座由很多决策树所聚集而成的森林,然后用所有决策树的结果进行投票,得出一个多数的、近似于平均的结果。
具体来说,按照今年抽签的分组结果,从小组赛的阶段开始预测,在所有的三十二支球队中,西班牙最终夺得冠军的胜算最大,约为 17.8%,高于德国的 17.1% 和巴西的 12.3%。
要构建这个森林, Groll 教授团队首先需要训练决策树,修剪好“枝杈”,不让没用的枝杈影响树的生长。这些枝杈就是参数,大量的经济、体育、地缘参数,比如国家人均 GDP、国际足联排名、国家来自哪个大洲、博彩公司给出的赔率,甚至精细到球员人数、平均年龄、顶级联赛球员比例和教练的工龄等等……
在不断训练的过程中,没用的参数就被排除出去了,就像被剪掉的枝杈。这个过程培育出了一座有很多树,每棵树都不是太枝繁叶茂的森林。团队认为,这样得到的结果应该是比较准确的。最后,这个森林根据模拟出每场比赛的进球数来判定球队输赢。
2018
巴西
在上一届2014年巴西世界杯上,东道主巴西队意外爆冷,只获得了第四名。今年巴西能否扭转乾坤,赢得冠军呢?
世界顶尖投行高盛 (Goldman Sachs)在小组赛阶段预测的结果显示:巴西最终夺冠的几率为 18.5%,高于法国 11.3% 和德国 10.7%;西班牙和阿根廷表现低迷在四分之一决赛被淘汰;德国和巴西将分别在半决赛中击败葡萄牙和法国晋级;
高盛预测巴西将在决赛击败德国一雪前耻,勇夺大力神杯:
高盛用的同样是随机森林模型,只是用了更少的参数,严格限制在球队和个人级别的指标上,基本上做了一个高级版的《足球经理》游戏系统。
最后只有五个主要指标或者变量,相关性从高到低:球队评级、球员评级、球队近期表现、对手近期表现和球队近期进球势头。
凭什么说西班牙和阿根廷表现低迷?做了 20 万次模拟(比多特蒙德工业大学多了一倍)之后,高盛经济学家认为抽签导致西班牙和阿根廷在小组赛、淘汰赛就被迫面对强敌,而前面提到的五个指标打分,这两队在面对巴西和法国时表现不会太好。
下图为 2014 和 2018 年高盛给各队的打分:
今年,高盛认为得分最高的和当年一样还是巴西队。
同样押宝在巴西队的还有不少团队和专家。比如说肯尼亚某家大型投资银行的投资银行分析师G·M日前在Medium上公布了他使用机器学习预测FIFA 2018的结果——巴西将赢得冠军,这与微软的AI和数据科学专家Peste的预测结果一致。
G.M使用了两个来自Kaggle的数据集,包含了从1872年到2017年国际足球比赛的结果,做了一些特征工程,选择跟2018年世界杯最相关的特征进行预测。
他通过逻辑回归的模式,,一种分类器算法。逻辑回归通过使用逻辑函数预估概率,从而衡量分类因变量和一个或多个自变量之间的关系。简单来说就是,给出一组一定相关的数据之后,通过逻辑回归就能预测结果。
而微软的AI和数据科学专家SorinPeste的预测过程则更加完善。在数据的选择上,除了历年世界杯结果,Peste还使用了欧洲杯、奥运会等大型比赛的数据,以及这些比赛的胜率分布。
在模型的选择上,Peste用的是随机森林(深度500),一种根据呈现给它的特征生成多个决策树的算法,并且每个单独的树对每个新输入向量的结果“投票”。随机森林的速度快,相当准确,可以对泛化误差进行无偏估计,因此不需要交叉验证。
不同的是,在这两者的预测结果中,第二名分别是德国和阿根廷队。
2018
结语
众说纷纭的推测也从侧面说明了人工智能分析预测的结果只能说有一定参考价值,足球比赛的赛场上,如果要用一句话来说,那就是一切皆有可能,预测冠军,不能只看数据,更要看临场发挥。无论各家的夺冠预测是否有道理,都只是比赛前大家闲谈的谈资而已。就在刚刚,乌拉圭在比赛到第八十九分钟的时候,被乌拉圭定位球破门,而在赛前,多少人工智能都预测埃及对乌拉圭必输,因此,竞技体育的赛场上,永远不是数据为王。
跟奥运会一样频率的举办周期让世界杯看起来如此珍贵,它既是追求足球梦的国家在这个领域梦寐以求的舞台,也是所有参赛球员的终极梦想,更是每个球迷的狂欢日,当然,对他们每一方来说,世界杯也都是修罗场,这里有激情、欢呼,也有失意和泪水。
无论预测谁夺冠,对大多数人来说,世界杯无非是个休息聚会的借口,大家在工作之余,找到一个可以共同聊聊的话题,暂时放下生活中所有的失意,端起啤酒,畅聊人生,岂不快哉。所以,这种时候就忘掉人工智能吧,身为人的喜怒哀乐,好好体验就好~祝大家看球愉快。
X+AI,关注CETC
关注中国新一代人工智能
领取专属 10元无门槛券
私享最新 技术干货