「注:文章来自国际电信联盟(ITU)」
当谈到新兴技术在改善世界各地人们生活的潜力时,你首先想到的可能不是电子游戏。然而,虚拟游戏可以在训练人工智能 (AI) 以对现实世界产生积极影响方面发挥重要作用。
每年,国际电信联盟(ITU)都会举办 AI for Good (“AI向善”)峰会,以展示人工智能在支持联合国可持续发展目标方面的技术进步。国际电信联盟(ITU)还制定了电子游戏体验的标准。
在观看近期国际电信联盟(ITU)有关在线游戏服务质量标准的网络研讨会时,世界各地的研究人员目前需要努力将人工智能和电子游戏这两个领域结合起来,以营造可以帮助机器从游戏数据中学习并提供洞悉人工智能开发的环境。目标是使用虚拟游戏结构来提高人工智能的自学能力,然后可以将其应用在现实世界中的应用(场景),例如促进医疗保健的进步以及城市的智慧化与可持续发展中。
那么电子游戏如何加快人工智能的发展步伐,让全世界的人们在日常生活中都能看到他们的有益之处呢?
长期以来,游戏一直是衡量人工智能 (AI) 技术进步的方式,通过在策略中与顶尖人类玩家进行较量来展示计算机算法的“智能”程度。
“整个电子游戏提供了我们所拥有的最好的智力测试。”
——Julian Togelius纽约大学坦登工程学院副教授
纽约大学坦登工程学院副教授朱利安·托格利乌斯 (Julian Togelius) 说:“整个电子游戏提供了我们所拥有的最好的智力测试。” “电子游戏是训练 AI 算法的一种很好的方式,因为它们旨在循序渐进地让人类的思维经历越来越难的挑战。”
Togelius 解释说,电子游戏旨在通过让玩家专注于克服障碍和跟随后续故事等元素来挑战人类的思维。他说,游戏设计的一个核心理念——也是许多人喜欢玩游戏的部分原因——是玩家一直在学习。
他说,这使得电子游戏成为训练 AI 的理想环境。游戏提供结构框架、重复训练以及能力强化,这都有助于(AI的)算法学习。
Togelius 说,与在物理空间中学习完成任务的机器人相比,虚拟环境还允许算法以更低的成本更快地开发。
“用机器人执行 10 次任务的时间,可以让算法玩 10,000 次游戏,”他说,“你不必担心它会不会(如机器人实验一般)损坏或过热。”
虚拟游戏对人工智能的物理性优势已经开始显现。
例如,OpenAI 的研究人员最近展示了一种算法,该算法可以通过相当于100年的反复试验,去教会自己操纵一个立方体。
Togelius 说,展望未来,虚拟训练可以直接应用于现实世界的实践,例如使用虚拟驾驶游戏来训练人工智能以用于自动驾驶汽车。
腾讯自动驾驶TAD Sim仿真场景
自动驾驶汽车的技术进步有提升道路安全性、减少交通拥堵、减少排放等其他好处。实现自动驾驶,是国际电信联盟(ITU)在帮助实现联合国可持续发展目标的第 11项——“建设更智能、更可持续的城市”中的一部分贡献。
Togelius 解释说,但(我们)也有机会跳出框架思考,将电子游戏中学到的经验应用于新领域。例如,在星际争霸(StarCraft)(这是一款复杂的多人在线游戏)中训练人工智能,玩家必须使用策略来推进赛程,这可以培养管理技能,他说。
“你正在制定战术和战略位置,建立和协调后勤网络,并确保资源正常运转,”Togelius说。“如果一款游戏有许多与现实世界任务相同的挑战,那么它就证明了[算法]可以学习类似于现实世界的任务。”
观察算法在电子游戏中的表现还可以深入了解它们的行为方式。Togelius 说,这有助于研究人员更好地了解算法如何解决问题并做出决策。
“通过观看 AI 代理玩游戏,我们可以更多地了解 AI 擅长什么以及人类擅长什么,”他说。
这一点可以帮助公司和政策制定者去识别在哪些领域人工智能能够以有利于人类的方式,来提高效率或支持现有的工作。在这些场景中观察 AI 的另一个好处可能是发现新技术或新机会。
例如,根据德国弗莱堡大学机器学习研究人员今年早些时候发表的一篇论文所述,一种使用进化策略的算法,其中最成功的算法能够生存和进化,利用电子游戏 Q*bert 中的一个bug,来累积几乎无限的积分。
该论文的作者之一弗兰克·哈特 (Frank Hutter) 表示,在这款游戏推出 36 年的时间里,包括开发者在内的任何人都没有发现这个漏洞。
Hutter 解释说,该算法的探索行为,以及为了长期最大化积分而不断尝试的意愿,帮助它找到了故障。
“按照设计,它着眼于长期依赖关系,”他说。“它只对‘最终分数’感兴趣,而其他方法则专注于‘如何快速获得积分’,这就是人类尝试玩游戏的方式。”
人类和人工智能,都仍有很多东西需要学习。例如, OpenAI 在 Dota 2 中战胜一支人类玩家队伍的几周后,它在电子游戏的年度锦标赛中输给了职业玩家。
Togelius 说,展望未来,如何将 AI 的能力从特定任务扩展到更广义的“智能”,是我们需要思考的问题。
“我们非常擅长通过训练算法来做特定的事情或玩特定的游戏,但我们在广泛化应用方面仍在婴儿学步阶段”他说。“现在‘玩游戏’的人工智能和研究给人工智能界的回馈是,人类正在开发可被广泛适用的方法,这些方法既是为玩游戏而开发,也可以有其他用途”。
雷锋网雷锋网