2010年南非世界杯,神奇的章鱼保罗因成功连续预测了8场赛事而名扬世界。
八年,弹指一挥间(没忘记你,巴西世界杯)。这一届的世界杯冠军又将花落谁家?显然,章鱼保罗已然指望不上了,但新的技术已经迫不及待地登场,8年后的俄罗斯世界杯,人工智能登场了。
来自德国多特蒙德技术大学的 Andreas Groll 和他的同事给出了一个答案。
他们使用了一种结合机器学习和传统统计学的叫做“随机森林”(Random Forest) 的算法,来分析最有可能夺冠的球队。
随机森林算法可以分析大型数据集,同时避免了其他数据挖掘算法的缺陷。传统的数据挖掘算法假设未来事件可以由决策树决定,该决策树通过引用一组训练数据来计算每个分支的结果。然而,决策树有一个问题,即在分支过程的后一阶段,由于训练数据稀疏,容易产生巨大变化,从而导致决策严重扭曲,产生过度拟合问题。
随机森林算法则不同。它不是计算每个分支的结果,而是计算随机分支的结果,如此计算多次,每次都有不同的随机选择的分支,最终结果是所有这些随机建构的决策树的平均值。
这种方法有显著的优点。它不存在困扰普通决策树的过度拟合问题,并且可以显示关键变量。因此,如果一个特定的决策树包含许多参数,很容易看出哪些参数对结果的影响最大,而弱变量可以被忽略。
Groll 和他的同事正是用这种方法来模拟 2018 世界杯。他们对球队可能进行的每一场比赛的结果进行建模,并利用结果构建出最有可能的比赛进程。
Groll 和 co 选定了一系列可能决定结果的潜在因素进行建模:一国 GDP 和人口数、国际足联对国家队的排名、球队本身属性(比如队员平均年龄、拥有的欧冠球员的数量、是否有主场优势等)。
下图显示了球队在整个比赛中的赔率,包括最有可能获胜的球队。根据研究人员的计算,西班牙最有可能胜出,概率为 17.8%,略高于德国。
雷锋网注:AI 预测的世界杯排名
如果德国队在小组赛阶段获胜,在 16 队淘汰赛阶段更有可能遭遇强敌,算法得出德国进入四分之一决赛的几率为 58%。相比之下,西班牙不太可能在最后的 16 强中面临强大的对手,因此有 73% 的机会进入四分之一决赛。
但是!在 Groll 和 co 对整个比赛进行了 10 万次模拟后发现,在比赛开始的时候,西班牙机会最大,但如果德国打进四分之一决赛,冠军就会易主。
昨晚想必大家已经兴奋地看完了第一场比赛,东道主俄罗斯 5-0 完胜沙特阿拉伯,但遗憾的是,根据他们的预测,这两支球队都不可能进入四分之一决赛。
当然,有人对这些预测持怀疑态度。由于足球比赛随机性太强,这种精确的比赛过程在实际比赛中可能性太小。
此外,他们的机器学习算法显然没有预测到,西班牙会在球队首战前两天解雇并更换主教练。
梅西曾经说过:“在足球中,如果没有严谨和精确,才能和优雅就没有意义。”
高盛在编制 2018 年世界杯的预测时,似乎把他的话放在了心上。
该公司使用机器学习来运行 200,000 个模型,挖掘团队和个人球员属性数据,以帮助预测特定的比赛得分。然后,高盛模拟了 100 万次比赛的变化分析,计算出每个球队的晋级概率。
下图显示了高盛如何看待世界杯比赛进程。每个国家旁边的数字代表该球队是否能超过对手,并利用机器学习算法进行比赛迭代。
雷锋网注:高盛预测图
以下是高盛得出的关键结论:
预计巴西将以 1.70:1.41 的比分击败德国,赢得第六次世界杯冠军;
尽管法国举起奖杯的几率比德国高,但预计在半决赛中与巴西的对决将使其无法赢得冠军;
英格兰有望进入四分之一决赛阶段,高盛表示将输给德国;
西班牙和阿根廷预计将落后,都将在四分之一决赛中失利;
尽管俄罗斯是世界杯主办国,但预计不会从小组赛中出线;
沙特阿拉伯是黑马,在小组赛阶段会领先于俄罗斯(显然已经预测错了)
雷锋网注:俄罗斯进球,普京得意摊手
via: MIT Technology Review ;Business Insider ;Motherboard
相关文章:
世界杯今晚开波!不光球迷和小龙虾,中国的移动支付也去了俄罗斯
人工智能“世界杯”360夺冠 刷新谷歌微软保持的“世界记录”