牛津大学计算机科学系主任、DeepMind-Oxford Partnership监事——迈克尔·伍尔德里奇(Michael Wooldridge)。是现金今著名智能体理论研究学者,著作有《多Agent系统引论》,是当今关于多Agent系统这个重要论题的第一本教材。
在其二十年的工作生涯里,他几乎获得了人工智能领域的所有荣誉:ACM(国际计算机学会)、AAAI(美国人工智能学会)、EURAI(欧洲人工智能学会)成员,Academia Europaea(欧洲科学院)成员、ERC(欧洲研究学会)委员,堪称人工智能领域的达人。
作为雷锋网8月份的CCF—GAIR大会的学术大牛嘉宾之一,近日我们对其进行了专门采访。
这个智能体的核心是“社会性”。人和动物区别开来的一个重要特征就是我们作为智能的,社会性动物,我们有语言,可以相互合作,协调,谈判来实现一些远超月个人能力范围内可以实现的事情。
所以AI如果忽视了“社会性”这个属性,它在接近或者超越我们的路上将会缺失许多东西。
我不知道其它智能体研究者是否会称它为智能体,但我把它定义为单智能体,因为它没有体现在任何环境中,也不曾以任何方式作用在这个世界上过。因为通常我们都认为智能体是存在于某些环境中的。
现在深度学习研究者们有个有趣的挑战,如何有一个学习系统可以分享他们的经验——分享他们学习到的经验,就像人类在学习完英语后,又把他们的经验用去学韩语,西班牙语等其它语言。
贸易机器人就是个很典型的例子,这个程序可以买东西和卖东西,现在国际贸易中正大量用到这个程序,AI就应用地更广了,我希望来年这个增长有更大的发展。
健康—智能手机和其它的设备里的各种传感器,都在监视我们的健康状态。
娱乐,看看口袋妖怪里的AI技术就知道了。
医疗,人工智能正在为我们寻找新的药物(和药物形式)。
自动驾驶,美国有359万卡车司机,我相信20年后,这些都会被自动驾驶代替,这对社会是个巨大的改变。
物流/规划,AI在这块领域会找到更有效的处理方式。
本质上区别还是我上面提的“社会属性”,之前的AI一开始没有对这点花太多注意力,但智能体(系统)一直在聚焦这件事。
在一些我们有特定任务要完成的领域AI非常成功,有时我们甚至能评估浙西任务的完成情况,但迁移到有些我们都不太好定义的地方应用,目前没有太多成功的例子可以拿来佐证。
关于这点,谁要是觉得除了AlphaGo会赢后还会有其它的结果,剩下的只是参赛者会觉得很惊喜,柯洁也会经历这个过程。我更感兴趣的是AlphaGo能不能教人类下得更好,但现在我们不知道它是如何做到的,这是个问题。
他们不是完全不同的两种东西,强化学习的基本思想是,倾向于加强过去已经成功的执行操作的概率。
而深度学习是在神经网络的背景下,关心一个类似的想法。他们都有着类似的想法,以及需要重复训练这个过程。最后在我眼里,技术是互补的,而不是竞争的。
至少目前,我们不知道如何通往AGI,也没人敢说他知道这个,机器学习近几年虽然有重大进展,但是我们不知道意识或者自我意识是如何组织的,如何进步的,以及它和大脑的微观结构有什么关系,所以AGI还有很长一段时间要走。
在多智能体系统里,有不同的方式组织活动,避免系统延迟一直是个问题,一种方法是任务共享,这时任务被分解成更小的任务,分享给更小的代理。甚至有时需要重新组装这些任务。
另一种方法就是“结果分享”,代理所做的就是分享信息,如果我认为这个信息对你有用的,我跟你一起分享。这些方法都有优点和缺点,在多智能体系统研究的关键中,懂得在一个特俗问题中哪个才是最适合的解决方法很关键。
在我的经验中,多智能体系统里,有不同的方式组织活动,避免系统延迟一直是个问题。一种解决方法是任务共享——这时任务被分解成更小的任务,分享给更小的代理。甚至有时需要重新组装这些任务。
另一种方法就是“结果分享”——代理所做的就是分享信息,如果我认为这个信息对你有用的,我跟你一起分享。
最后,这些方法都有优点和缺点,在多智能体系统研究的关键中,懂得在一个特定问题中哪个才是最适合的解决方法很关键。
智能体是人工智能领域中一个很重要的概念。通常我们认为任何独立的能够思想并可以同环境交互的实体都可以抽象为智能体。迈克尔·伍尔德里奇过去花了20多年时间专注人工智能的这个前沿领域———智能体 (Agent) 的研究。
正好这个Agent(S)系统在博弈,调度优化,金融,游戏,多机器人控制方面都非常适合,所以AlphaGo这种博弈类高手机器系统诞生在牛津大学也说的上“顺利成章“,而未来,在人工智能这个“超级网络”中,我们有理由在各个场景中都会充斥着multi-agent的概念。