一周之前,MIT 编辑部致电阿里巴巴人工智能实验室首席科学家王刚,向他传达了获奖讯息,第一个蹦入王刚脑海的反应是—— I'm lucky . 王刚向雷锋网表示,在身边优秀的行业前沿人才如此多的情况下,获此殊荣,运气成分要占一定比例。
1、
8月16日,《麻省理工学院科技评论》(MIT Technology Review)杂志揭晓了 2017 年全球青年科技创新人才榜(TR35)的评选结果。这一次,国内阿里巴巴人工智能实验室首席科学家王刚、阿里云首席安全科学家吴翰清获此殊荣。这也是自该奖项创立18年以来,首次中国公司里同时有两人入选榜单。
本次35名上榜者中,共有6位华人,分别是——创立 Project Include 的 Pinterest 软件工程师周怡君(Tracy Chou)、Law.ai 和 Wafa Games 的创始人龚晓思、柔宇科技创始人兼 CEO 刘自鸿、阿里巴巴人工智能实验室的首席科学家王刚、阿里云首席安全科学家吴翰清,以及 AutoX 创始人兼 CEO 肖健雄。
该榜单分为 5 大类别:
· 发明家(Inventors)
· 远见者(Visionaries)
· 先锋者(Pioneers)
· 创业家(Entrepreneurs)
· 人文关怀者(Humanitarians)
所谓TR35 ,即是针对35岁以下青年科技才俊、为找出最有可能改变世界的牛人而设立的奖项。从 1999 年开始,该杂志每年会在全球 IT(计算机、通信、网络)和生物医药、商业等领域内,从影响力、创新力、进取力、未来潜力、沟通力五个维度进行评估,挖掘学术界和工业界的35位科技创新精英。
此前,Google 联合创始人拉里·佩奇(2002年)和谢尔盖·布林(2002年),Linux 之父林纳斯·托瓦兹(1999年),Facebook 创始人马克·扎克伯格(2007年),Yahoo 创始人杨致远(1999年),Apple 设计总监乔纳夫·伊森(1999年)等,都曾是该奖的座上宾。
对于获奖原因,王刚对雷锋网表示,评审团应该也是主要考量候选人对后续科技发展带来积极的趋势性影响。正如《MIT Technology Review》总编辑兼发行人Jason Pontin所说,“这些年来,我们所选择的这些青年才俊的创新成果和公司一直深刻地影响着人类进步的方向。”
2、
王刚是谁?
前新加坡南洋理工大学终身教授,同时也是人工智能领域最顶尖杂志IEEETransactions on Pattern Analysis and Machine Intelligence的编委(Associate Editor),曾多次受邀成为人工智能顶级学术会议如InternationalConference on Computer Vision的领域主席,在深度学习算法领域具有深厚的研究积累和国际权威。
今年3月,王刚加入阿里巴巴AI Labs,负责机器学习、计算机视觉和自然语言理解的研发工作。
实际上,早在2016年,王刚因在深度神经网络设计上的卓越贡献,便已成为MIT评选出的10名亚洲区35岁以下青年科技创新人才得主之一。在加入阿里巴巴之后,因推动了AI商业化再次入选了MIT全球青年科技创新人才榜。今年7月,阿里AI labs发布的人工智能消费级产品“天猫精灵X1”,就运用了王刚的多项研究成果。
谈到与阿里的结缘,王刚向雷锋网表示,可以追溯到去年,即与阿里内部人员有过接触。阿里人工智能实验室定位为提供消费级 AI 产品紧密相关,而其优秀的人才团队与技术资源,可以辅助王刚将其耕耘多年的深度学习算法技术实现真正落地,离消费者更近、直接创造C端产品,这也是他决定加入阿里的重要原因
加入阿里之后,王刚将主要精力放在AI labs上,人工智能新硬件与降低智能终端成本、生物认知启发、量子力学等,都是实验室正在攻克的方向。目前主要推出的落地产品,即为天猫精灵X1 。
对于目前智能音箱行业的泡沫现象,王刚对雷锋网表示,目前行业还处于早期培育阶段,每个新生事物出现时,都要遭受很多质疑,而支撑条件都是后天创造出来的。相信,未来在较短时间内,就能看到智能音箱产品逐渐成为大众喜爱的产品。“不要受限于用户现有的习惯 要为用户创造习惯。”王刚这样强调。
具体技术上,天猫精灵使用了AliGenie第一代中文人机交互系统,能够精确理解用户语言,进行智能对话,同时提供个性化用户服务。阿里AI Labs将AliGenie开放给开发者、硬件厂商所使用,即是希望让更多具有人工智能能力的产品,快速落地,被消费者所使用。
即便如此,王刚对智能音箱未来的看法,仍是坚持“语音+视频”是大趋势。他认为,语言、图像,包括触摸、气味等的输入,会使学习更高效。当然,面临的挑战也同时存在,“这是一个渐进的过程。”
阿里人工智能实验室办公室
3、
加入了阿里人工智能实验室的王刚,具体带来哪些落地技术?
王刚主要的研究领域集中在深度神经网络上,他为阿里巴巴带来的贡献之一也来源于相关的研究成果。深度神经网络是一项关于机器学习的研究,它能够让机器在海量数据中寻找规律,自动对数据进行分析。同时,此项技术也是AlphaGo的基础理论之一。
但目前,据雷锋网了解,大多数现有神经网络均需要科学家具备某一专业领域的相关知识才能驱动,不同的领域的神经网络所需要的知识理论也完全不同,这就极大地限制了神经网络的大规模应用。
例如,当我们在做图片匹配时,不同的图像对应的相似区域是不一样的。但是大部分现有方法都没有考虑到这样的差异性,从而限制了深度学习的效果。
针对于此,王刚在深度神经网络的研究中,提出了自适应神经网络。它降低了人工筛选数据的工作量,能够根据输入的数据特点,自适应的匹配数据进行学习,从而极大的增强了神经网络的效果。这个方法在很多重要的机器学习问题上都取得了比传统方法更好的结果,也应用到了AI labs的具体产品中。
本质来讲,神经网络是人工智能的“大脑”,这项研究让人工智能具备更强的学习能力,从“应试教育”进化到“自主学习”。
以行人的识别为例,在多个场景和摄像头之间实现行人的再次识别,是视觉分析和场景监控的核心技术。但,由于行人在不同场景下的变化,稳定的行人再识别是非常有挑战的问题,因此,王刚创新地提出了一种神经网络结构。
行人再识别的问题是输入两张图片,然后去识别这两张图片里是否包含了同一个人。传统的神经网络方法,是在最后的特征表达层上,将两张图片结果进行相似比较,而该网络结构创新地提出了门匹配的机制——在两张图片的各个中间特征层之间加入门匹配机制。
门机制图解
这种起源于LSTM的门机制,可以在特征抽取的过程中,通过比较两张待匹配照片之间的相关性,对那些有助于行人再识别的特征进行强化,从而较好地提升行人再识别的准确率。这种可以训练的门机制,不仅保留了端到端训练,而且实现了在预测过程中根据不同输入情况进行特征抽取的控制,是对传统多层神经网络的非常重要的改进。
虽然这是一项图像识别技术,但核心的门匹配机制可以扩展到多个技术领域,实现更高精度的识别率。这一技术思路也同样将应用在AI labs的产品中。