Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >这么多人用AI预测FIFA 2018,为什么总是会失败?

这么多人用AI预测FIFA 2018,为什么总是会失败?

作者头像
用户1737318
发布于 2018-07-23 02:01:20
发布于 2018-07-23 02:01:20
6170
举报
文章被收录于专栏:人工智能头条人工智能头条

作者 | Kaveh Bakhtiyari

译者 | Linstancy

编辑 | Jane

出品 | 人工智能头条(公众号ID:AI_Thinker)

【导读】7月16日凌晨,2018 年俄罗斯世界杯在法国与克罗地亚间一场精彩的对决后落下帷幕。法国队时隔20年再次托起大力神杯,克罗地亚队获得亚军,创造了一个又一个奇迹,虽败犹荣。在过去的一个月里,无论是球迷经验与期望的预测,还是各路研究人员通过各种机器学习方法的预测,都没有人预测出这样的结果,FIFA 的结果无疑使这些预测有些尴尬。更是谁都没有预测到历经附加赛,三场加时赛,平均年龄近三十的格子军团凭借着钢铁般的意志,顽强拼搏的精神进入了决赛,而这些奇迹和促使奇迹发生背后的因素在我们的算法和模型中又该如何利用?这篇文章虽然不是在彻底解决这一些问题,但是对预测失败的案例分析让我们知道,不仅在 AI 技术应用过程中会受到很多限制,我们还有很长的路要走。

▌前言

2018 年FIFA 俄罗斯世界杯于7 月16日正式结束,法国队获得冠军,克罗地亚和比利时队分获二三名。和2014 年世界杯一样,许多研究人员试图提前预测结果一样,今年也不例外,研究人员和科学家们试图利用人工智能(AI) 和统计知识来预测本届FIFA 世界杯64 场比赛的结果。

近来人工智能(AI) 的声势颇盛,被称为是未来的技术。如今,人工智能也正在成为每个大中型企业不可或缺的一部分,但它的可信度有多高?在这篇文章里为大家展示一个简单的示例 —— 分析AI 在预测2018 年世界杯结果中的表现。(注:这篇文章中是在最近的几项研究中选取的,分析的方法和评价标准也是基于原研究进行的。)

预测FIFA 世界杯的结果有许多不同的方法。一种方法是针对团队能力和获胜概率,通过成对比较来模拟每一场比赛结果。Zeileis,Leitner 和 Hornik 使用相同的技术预测巴西将以 16.6% 的概率赢得本届FIFA 世界杯的冠军,其次是德国(15.8%)和西班牙(12.5%)。

瑞士银行瑞银(UBS)也预测了本届赛事的前 3 名的球队,他们的结果是:德国将以 24.0%的概率获得冠军,其次是巴西(19.80%)、西班牙(16.1%)。

他们的预测模型考虑了四个因素,分别是:

  1. Elo评级;
  2. 球队在世界杯预选赛中的表现;
  3. 球队在往届世界杯比赛中所取得的成绩;
  4. 主场优势。

该模型通过10,000次蒙特卡罗模拟进行校准,以得到最终获胜的概率和最近五次赛事的结果。

此外,2018年6月8日,来自德国的多特蒙德技术大学,慕尼黑技术大学和比利时根特大学的四位研究人员(A. Groll 等人)在arXiv 上发表了一篇关于2018 年世界杯冠军预测结果的研究论文。论文中采用著名的人工智能算法—— 随机森林算法和泊松排序算法,并在6月14日世界杯开幕前公开发表。他们使用的数据集是一个涵盖了过去四届FIFA 世界杯(2002-2014)的所有比赛。他们预测西班牙将成为冠军,其次是德国队和巴西队。

以上这三项研究预测的前三名结果都涉及西班牙,德国和巴西三支队伍,不同就在于对他们名次先后的顺序。他们分别采用了三种不同的预测方法,数据和数据特征,但最终产生的结果几乎相似。现在,世界杯结束了,我们可以来分析下这些预测失败的模型。

在这些研究中,将会分析的是 A. Groll 等人的研究方案。首先,他们使用了一个很好的数据源。其次,他们考虑了许多训练过程中的特征和参数。随后,他们采用随机森林算法。接下来,我将逐个分析这项研究中所涉及的数据特征,误差以及最终预测失败的原因。

▌数据特征

Groll 等人考虑了与团队自身相关的各种特征,比如:

  1. 经济因素(国家人均GDP,人口数量等);
  2. 运动因素(如ODDSET 概率,FIFA 排名等);
  3. 主场优势(如主办方,大陆,联邦等);
  4. 团队的组成结构(如队伍中同一俱乐部队友的人数,队员的平均年龄,参加冠军联赛的球员数量等);
  5. 团队的教练因素(如教练的年龄,任期,国籍等)。

总的来说,他们总结了这16个数据特征来分析每支世界杯参赛队。

▌分类模型

正如之前提到的,他们使用一种众所周知的算法--随机森林算法,该算法的工作原理是基于决策树,在许多数据分类任务中表现出很高的性能。此外,他们还引入泊松模型,根据当前的实力对各支球队进行排名。

随机森林算法预测的2018年FIFA 世界杯比赛结果

▌预测

经过了 10 万次赛事模拟后,他们的算法预测出西班牙队有 28.9% 的机会晋级决赛,其次是德国(26.3%)和巴西队(21.9%)。

▌错误

但是根据今年的世界杯结果来看,预测的前两支球队都未能进入四分之一决赛,更不用说决赛(巴西队进入四分之一决赛)。根据世界杯的实际结果和预测,模型的均方根误差(RMSE)和平均绝对误差(MAE)计算结果如下:

这两个指标显示了模型的错误,以及它可以在多大程度上准确地预测出最终的团队排名。尽管使用了 16 个特征以及大数据集(包含过去四届世界杯的比赛数据),但最终得到的 RMSE 和 MAE 值都很高,这使得模型缺乏可信度,而基于机器学习的 AI 方法(特别是随机森林算法)也无法可靠地预测出结果。在本届世界杯,俄罗斯,日本和伊朗的表现明显好于预期,另一方面,德国也没有晋级。

2018年 FIFA 世界杯中每支球队的预测排名、实际排名及预测差异结果(误差)。

▌AI 为什么失败?

在人工智能和机器学习领域,为模型训练和模型设计并提供适当的数据是非常重要。但在这种情况下,尽管拥有适当的数据(16个已清洗的特征),相对较大的数据量(过往四届世界杯的比赛数据)以及具有正确参数的优秀算法,但即使这样训练有素的模型最终仍会失败。我认为这种失败的原因在于我们所预测的本质。

FIFA 世界杯和很多其他以人为本的事件一样,比赛在赛前和比赛期间(最少90分钟)有太多的因素(远不止是本研究考虑的16个),这些因素被称为混淆变量。为了能够正准确地预测结果,每场比赛的每一分钟都要模拟出来。每分钟甚至每秒钟状态的结果都取决先前的状态,这种现象也称为马尔可夫链过程。错误的模拟状态很容易导致比赛产生不可靠的结果。

除了内部因素外,足球比赛的结果也可能受到一些外部因素的影响,例如不公平的裁判,天气,政治情况,甚至球员的个人问题等。而这些重要特征通常很难被衡量和收集。此外,总有一些探索和不确定性的机会,例如球员的一个致命失误或进球得分,这是不容易预测的。

简而言之,像 FIFA 世界杯或者一些以人的活动为基础的领域,具有随机和动态环境是如今人工智能技术还无法很好驾驭的领域。这个例子就很好地说明了我们必须非常注意 AI 在类似动态环境领域的适用性。此外,通过具有非常复杂的数据结构,针对任何的潜在偏差可能非常难以修正我们已经训练好的模型。存在的偏差会导致模型只适用于特定的群体决策。而实施这样的系统也将会对个人和公司产生巨大的问题,因此建议将人工智能应用于这种随机和动态环境时作为补充的决策平台。

2018年 FIFA 俄罗斯世界杯官方 logo

更多研究内容可参考: https://www.ubs.com/content/dam/assets/wm/global/cio/doc/investing-in-emerging-markets-en.pdf https://ideas.repec.org/p/inn/wpaper/2018-09.html https://arxiv.org/abs/1806.03208 原文链接: https://medium.com/@bakhtiyari/artificial-intelligence-failed-in-world-cup-2018-6af10602206a

*本文由人工智能头条整理编译,转载请联系编辑(微信1092722531)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-07-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
“打脸”世界杯:AI界没有预测比赛的章鱼保罗
即便不是足球迷,你也应该听说过章鱼保罗。2010 年南非世界杯,这条八爪鱼预测的比赛结果 8 猜全中,这一不可思议的神奇预测让它受到了全世界球迷的追捧,并赐封其为“预言帝”。
AI科技大本营
2018/07/24
4610
“打脸”世界杯:AI界没有预测比赛的章鱼保罗
机器学习预测世界杯:巴西夺冠
新智元报道 来源:Medium,Github,KDnuggets等 作者:李静怡,克雷格 【新智元导读】2018年世界杯开幕在即,谁会赢得最后的冠军?机器学习预测是巴西,而统计方法则认为德国会赢。
新智元
2018/06/22
8300
机器学习预测世界杯球队冠
3天后,2018年俄罗斯世界杯开打,首场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日拉开序幕。
IT派
2018/08/10
5060
机器学习预测世界杯球队冠
【史上最强世界杯预测】AI毒奶,EA封神!
【新智元导读】世界杯终于结束了。本届世界杯中,AI预测的夺冠热门德国、巴西、阿根廷等强队都被“毒奶”回家。而EA居然预测对了连续两届世界杯冠军,真的这么准?
新智元
2018/08/01
6630
【史上最强世界杯预测】AI毒奶,EA封神!
AI模型告诉你,为啥巴西最可能在今年夺冠!曾精准预测前两届冠军
这只位于德国海洋生物中心的神奇章鱼,不仅成功预测了德国队全部七场比赛的结果,还顺利地选出了最终的总冠军西班牙队。
新智元
2023/01/08
3190
AI模型告诉你,为啥巴西最可能在今年夺冠!曾精准预测前两届冠军
德国AI“算个球”:西班牙是冠军,只要别让德国进八强(严谨推理)
可能是由于人类(包括球王)预测不靠谱,前几届世界杯预测战况和冠军的任务,常常交给动物完成。
量子位
2018/07/24
1.3K1
德国AI“算个球”:西班牙是冠军,只要别让德国进八强(严谨推理)
2022世界杯冠军是巴西队?这次是AI说的
大数据文摘转载自学术头条 还有不到 6 天的时间,足球盛宴“2022 世界杯”将在卡塔尔上演。 各位球迷们,想必你们已经做好了熬夜看球的计划,甚至已经在内心中提前预测了今年的冠军。 随着 2022 世界杯的临近,各方预测也纷纷来袭。曼城主帅瓜迪奥拉就表示,他对阿根廷队的夺冠能力充满了信心;欧洲专业预测机构则认为,法国更有冠军相;球王贝利也预测,今年的冠军应该属于英格兰...... 当然,如往届一样,五星巴西依然是世界杯夺冠的最大热门。 那么,也许是世界杯最后一舞的梅西,能否带领阿根廷圆梦卡塔尔?由本泽马、姆
大数据文摘
2023/04/10
2160
2022世界杯冠军是巴西队?这次是AI说的
AI看了10万次世界杯后,预测巴西将捧起队史第六座冠军奖杯,夺冠率高达25%!
大数据文摘出品 作者:Caleb 世界杯赛程来到第11天。 相信昨晚阿根廷的球迷都捏了把小汗,虽然整场下来阿根廷全场围攻,共计23脚射门,但错失了太多机会,包括梅西的点球,但好在下半场攻势迅猛在开场拿下1球后乘胜追击,最终2-0击败波兰队。 本场比赛也使得梅西超越马拉多纳,成为阿根廷历史世界杯出场最多的球员。 小组赛继续爆冷。在D组最后一轮比赛中,突尼斯队以1:0战胜开场派出非主力阵容的法国队,但位列小组第三无缘小组出线,法国队以小组头名身份晋级16强。 虽然本届世界杯进行到此尚未过半,但关于本届世界杯冠
大数据文摘
2023/04/10
2660
AI看了10万次世界杯后,预测巴西将捧起队史第六座冠军奖杯,夺冠率高达25%!
【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析
随着2018年FIFA世界杯开赛在即,世界各地的球迷都渴望知道:谁将夺取梦寐以求的冠军奖杯?
CDA数据分析师
2018/07/30
5260
【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析
2018世界杯数据清单:真球迷看球必备,伪球迷速成指南(附完整赛程)
用段子缓解尴尬?本届世界杯没有中国队、没有贝克汉姆、没有科比、没有姚明之类的老梗已经烂大街了,完全笑不出来好吗?
IT阅读排行榜
2018/08/16
5240
投行、学界和科技界的世界杯冠军预测大战
从1998年的法国世界杯开始,知名投行高盛在世界杯之前都要发布一份关于世界杯经济学的投行报告,至今已经持续了 20 年,预测工具是一些基于经济统计学的数据工具。最近几年中,大量的 AI 公司也都加入了这些重要赛事的预测中。
HyperAI超神经
2019/12/01
4610
投行、学界和科技界的世界杯冠军预测大战
大数据预测世界杯 八种方法谁靠谱
西班牙、英格兰连续两场失利,小组赛即遭淘汰,不仅让一些球迷伤心欲绝,让彩民损失不小,还顺便连累了众多预测世界杯的高人欲哭无泪。这届世界杯在大数据火爆之后,不管是民间还是官方,都把大数据的概念运用到了世界杯预测上,但这些预测真的准吗?下面选取国内外主要的八种世界杯预测,对他们的预测方法进行简要的分析,看看谁的更准一些。 (1)百度分析最传统 据验证,今年全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,被戏称“神预测”。因此,这次百度收集网上的综合数据,然后进行整理、分析,最终通过大规模机器
大数据文摘
2018/05/21
8K0
高盛用AI预测2018世界杯结果,称巴西队将会夺冠
高盛用AI预测2018世界杯结果,预测哪支球队能够赢得2018世界杯。在2014年锦标赛预测错误之后,它再次尝试,并且计算表明,法国,巴西,葡萄牙和德国将在决赛中与巴西一起击败德国进入半决赛。
AiTechYun
2018/07/27
2740
高盛用AI预测2018世界杯结果,称巴西队将会夺冠
AI 预测到了正确的世界杯胜利者吗 ?
在过去的一个月里,卡塔尔 2022 年世界杯让我们目睹了一个又一个令人震惊的结果,甚至在决赛之前,让所有人的目光都聚焦在法国和阿根廷两支球队上,其实在球迷们心中,早就开始了各种猜测。😄 现在是时候回顾一下,灵媒、动物、超级计算机和人工智能最初对结果的预测,相较之下,「哪家强」? 人工智能 (half to half) 在比赛开始时,不同来源的人工智能做出了截然不同的预测。 BCA Research 的数据机构的一台超级计算机做出了一个得到巨大响应的预测。这台超级计算机预测,葡萄牙队将在决赛中对阵阿根廷队,而
mixlab
2023/02/03
2980
这个大力神杯,梅西已足足等了16年!AI预测:阿根廷冠军
由卫冕军法国对上寻求队史第三冠的阿根廷,同时也是两位顶尖球星兼巴黎圣日耳曼队友梅西、姆巴佩的「内战」。
新智元
2023/01/09
4340
这个大力神杯,梅西已足足等了16年!AI预测:阿根廷冠军
大数据预测世界杯靠谱吗?
网友“伟仔”: 今年大数据取代了章鱼保罗,成为预测世界杯战局的热门手段。不过这种预测靠谱吗?大数据真的能预测世界杯? 腾讯科技: 目前采用大数据预测世界杯的,既有百度这样的互联网公司,也有德银这样的知名投行。 一、预测确实使用了大量数据 通过采访百度的相关人士,我们发现百度预测世界杯的主要数据来源包括:百度搜索数据,球队基础数据,球员基础数据,赔率市场数据。百度大数据通过分析过去5年987支球队的3.7万场比赛数据,共涉及29610名球员,112,285,543条相关数据,构建了足球赛事预测模型。 为了
腾讯大讲堂
2018/02/09
9210
【数据分析】大数据揭示"27岁定律" 四年后国足将迎黄金时代
大数据分析揭示世界杯球员年龄存在“神秘定律”   岁月的齿轮继续流转,相比正在巅峰时期的梅西,内马尔与J罗还可以期待下一个四年。 富力指数   刚度过27岁生日的梅西今天凌晨向大力神杯发起了冲击,阿根廷队之所以在阔别24年之后得以重返世界杯决赛,原来其中蕴藏着一个大秘密,那就是队中的“灵魂”梅西完全契合世界杯的巅峰规律。在本次决赛之前,英国人进行了大量数据分析,得出一条“27岁定律”,他们通过本届世界杯32强11人首发阵容以及历届夺冠队伍的平均年龄统计,发现参加世界杯并且最有机会夺冠的
小莹莹
2018/04/19
1K0
【数据分析】大数据揭示"27岁定律" 四年后国足将迎黄金时代
论文Express | 德国本届世界杯胜算最大?帕绍大学基于ELO评级预测
大数据文摘出品 编译:halcyon、小鱼 离2018俄罗斯世界杯开幕的日子越来越近,学术界的球迷们也按捺不住期待的心情,纷纷用算法对2018世界杯的比赛结果进行预测。 巧的是,AI的预测结果纷纷看好德国队。前有德国帕绍大学(Universität Passau)利用ELO评级预测德国胜算最大,后有俄罗斯彼尔姆国立研究大学利用神经网络预测世界杯前三名将是德国队、巴西队和阿根廷队,并称这项预测的准确度超过80%。 从AI的预测结果来看,德国队更胜一筹。那么是如何进行预测的呢?一起和文摘菌来看看帕绍大学这篇最近
大数据文摘
2018/06/29
6040
AI预测世界杯2022冠军之路
最近世界杯正在打得火热,同时各个小组的排位赛也打得如火如荼。因此想着能不能用历年以来的世界杯成绩来模拟预测今年的夺冠球队呢?
算法一只狗
2023/01/18
5920
手把手教学,AI预测足球概率
因此我们可以利用这两份数据进行数据分析。在模型中,利用随机森林进行预测,可以得到具体的模型结果。
算法一只狗
2024/10/12
4160
手把手教学,AI预测足球概率
推荐阅读
相关推荐
“打脸”世界杯:AI界没有预测比赛的章鱼保罗
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档