随着人工智能成为科技巨头们的下一个决战场,各大科技巨头均加紧了对相关学术人才的招揽。深度学习的“四大天王”中,Geoffrey Hinton在Google,Yann Lecun在Facebook,Andrew NG在百度,正当大家猜测苹果是否会向学术界硕果仅存的Yoshua Bengio示爱时,苹果在本周一公布,来自卡内基梅隆大学(CMU)的副教授Ruslan Salakhutdinov,成为苹果首任AI总监。
Ruslan Salakhutdinov,Who?
对于公众来说,Ruslan Salakhutdinov是一个不怎么熟悉的名字,在维基百科的词条下,这一名字对应的(更知名的)是一位俄罗斯足球运动员。那么问题来了:
为什么苹果放着那么多大牛不找,而是找了一位今年2月才从助理教授升上来的“资浅”副教授?
但对于深度学习领域的学者来说,Ruslan Salakhutdinov并非籍籍无名之辈。从整个神经网络和深度学习的历史看,最重要的拐点是2006年7月,Geoffrey Hinton为第一作者的两篇论文《A Fast Learning Algorithm for Deep Belief Nets》和《Reducing the Dimensionality of Data with Neural Networks》的发布,前者首次提出了layerwise greedy pretraining的方法,开创了深度学习方向;后者提出通过最小化函数集对训练集数据的重构误差,自适应地编解码训练数据的算法deep autoencoder,作为非线性降维方法在图像和文本降维实验中明显优于传统方法,证明了深度学习方法的正确性。正是这两篇论文引起了整个学术界对深度学习的兴趣,才有了近十年来深度学习研究的突飞猛进和突破。
而Ruslan Salakhutdinov,就是深度学习历史上最重要的标志性论文之一、发布在Nature杂志上的那篇《Reducing the Dimensionality of Data with Neural Networks》的第二作者。此时的他不过是刚刚进入Geoffrey Hinton门下不久的一名博士生(Ruslan Salakhutdinov于2009年获得博士学位),但并不影响其在深度学习领域中的辈分。
Ruslan Salakhutdinov对人工智能的贡献还在于学习深度生成模型的研究上。2007年前后,Ruslan Salakhutdinov与Geoffrey Hinton提出了一种在前馈神经网络中进行有效训练的算法。这一算法将网络中的每一层视为无监督的受限玻尔兹曼机,再使用有监督的反向传播算法进行调优(Ruslan Salakhutdinov的博士论文就是这方面的内容)。在获得博士学位后,Ruslan又花了两年时间从事博士后研究工作,从2011年起在多伦多大学担任助理教授,今年2月,他从多伦多大学转到卡内基梅隆大学,并实现了从助理教授到副教授的跨越。
从2006年的标志性论文发表到现在为止的十年中,Ruslan Salakhutdinov的研究成果层出不穷。截止本文发布之日,Ruslan Salakhutdinov的论文总引用数量达到16819次,其中近5年的引用次数为15191,这也说明了在其一直活跃在深度学习的前沿领域。
从另一方面,苹果在AI研究方向上更加低调和和现实,在雷锋网之前的《重磅:苹果人工智能最完整解密,iBrain早已无处不在》与《苹果人工智能不行?你被它的表象骗了》两篇文章中也可以看出,苹果在其人工智能负责人的选择上并不以一味追求名气,而是将AI作为其解决实际问题的工具。有理由相信,苹果最终选择Ruslan Salakhutdinov,是因为Ruslan Salakhutdinov的科研方向能够最好的实现苹果的需求。
那么,苹果最看重Ruslan Salakhutdinov的什么特质呢?
答案是:其创造力和天马行空的想象力。
这一点从去年Bloomberg的一篇报道可见一斑。在Ruslan Salakhutdinov成为苹果AI总监后,Bloomberg记者Jack Clark发表推特称,“虽然Ruslan在人工智能领域做出了卓越的贡献,但在我心目中对他的印象依然是那个‘厕所计划’的幕后推手”。而Ruslan也转发了这条包含这篇报道的推特。雷锋网特此编译全文如下:
对于那些自尊心极强的艺术家来说,十有八九不愿意画一幅类似“田野中的抽水马桶”的作品。不过,先进的人工智能技术却能赋予计算机具备这样的能力,绘制出任何充满离奇想象力的场景。
如果你看下上面这张图,会发现其实是一个“田野中的抽水马桶”的拼贴画,它是靠计算机智能想象力绘制出来的,你可以先花上一分钟时间,自己冷静体会下。
多伦多大学的研究人员设计出了一套系统,允许用户输入关键词,比如“田野里的抽水马桶”或其他任何离奇的场景,然后计算机就会根据这些关键词绘制图像。
实际上,硅谷不少人工智能实验室也在研发类似的项目,比如像微软和百度这样的科技公司,他们在过去的研究中已经有所突破,可以让计算机读取图像中的内容。而像谷歌公司今年推出的 Deep Dream 研究项目,则是能让计算机在图像上画出一些微小的细节,但是绘制规模较大,且与某个主题想贴切的图像,Deep Dream 目前还无法实现。
当然你会发现,这张来自于多伦多大学发表论文中的“田野中的马桶”照片,其实也是非常模糊,而且也是一副较小的画作。之所以会有这样的结果,是因为训练计算机画图本身就是个异常复杂的过程。
机器学习初创公司 Indico Data Solution 在相关领域也进行了深入研究,希望能让计算机绘制出高质量的画作,他们和 Facebook 公司的人工智能研究人员共同开发了一套能够合成人脸的智能系统,见下图:
看到上面这些由人工智能绘制的人脸,是不是感到有些毛骨悚然?实际上,Indico Data Solution 公司和 Facebook 公司的人工智能研究人员所组成的团队正在利用神经网络开发能够绘图的人工智能工具,他们并没有让软件去抓取图片中的重点特征,而是采取了让软件“自主生成图片特征”的方式——去绘制人脸或卧室等图像。Indico Data Solution 公司所开发的工具,其实并没有多伦多大学的复杂,其重点,是要让神经网络掌握理解图像和语言之间关系的能力。但是,根据 Indico Data Solution 公司联合创始人 Alec Radford 透露,他们研究的一个重要方向,其实是要让计算机在开始自主绘制现实图像之前,先去学习、了解这个世界。
让计算机画画已经引发了研究界的轰动。谷歌高级研究科学家 Ian Goodfellow 表示,他期待明年和其他研究人员举行会议专门讨论这项研究,甚至希望能够专门创立一家初创公司来从事相关研发工作。
也许未来,这项研究真的会带来一定的商业影响力,甚至能让艺术家和设计师失业。科技公司一直渴望实现设计工作自动化,比如 Autodesk 公司,他们就在和一家名为 Grid 的人工智能初创公司合作,试图开发能够自动设计家具的软件。而像 Facebook 和谷歌这样的科技巨头,也一直在尝试在自己的产品中整合人工智能技术。
Ruslan Salakhutdinov 是多伦多大学助理教授,目前负责“田野里的抽水马桶”项目,他表示现在的研究已经让他们了解到很多神经网络的工作原理,也有助于提升其他人工智能领域的研究。
(原文刊于bloomberg.com)
Ruslan Salakhutdinov的其他重要研究成果还包括(附PDF链接):
《学习深度生成模型》