雷锋网 AI 科技评论按:自 14 岁进入中科大少年班开始,陈云霁便展现了非凡的科研实力,25 岁时(2008 年)获导师胡伟武钦点担任 8 核龙芯 3 号的主架构师,也是在 25 岁这年他与主攻算法的弟弟开始智能算法和芯片设计的交叉研究,让中国在智能时代来临之际有可能实现智能芯片领域的「弯道超车」:目前国际智能芯片领域他引最多的两篇论文( DianNao 和 DaDianNao)均来自陈云霁团队,而寒武纪深度学习处理器也入选了国际计算机学会通讯的研究热点(每年评选十个,大陆为首次入选)。
作为当下人工智能芯片领域备受瞩目的科学家,陈云霁参加了 CNCC 2018 的「CPU 及 xPU 芯片未来之路」论坛并发表演讲,在会后的专访中,陈云霁与雷锋网 AI 科技评论记者分享了自己近期的一些想法,当中包括中科院计算所的师门传承关系、寒武纪的发展之路、接下来的研究方向以及对于基础研究的感悟。(采访:岑峰 ;整理:黄善清)
陈云霁是中国科学院计算技术研究所研究员(正教授),国际首个深度学习专用处理器「寒武纪」的主设计师,研究领域包括微体系结构、并行计算、计算智能、视频处理等。他在包括 ISCA、HPCA、MICRO、ASPLOS、ICSE、IJCAI、ISSCC 以及 8 种 IEEE/ACM Trans 在内的学术会议及期刊上发表论文近一百篇,申请发明专利近一百项,在 2015 年时入选《麻省理工科技评论》35 岁以下的全球最佳 35 名创新人士,同时也是首届国家自然科学基金「优秀青年基金」以及首届中组部「青年拔尖人才计划」的入选者。
从曙光到寒武纪——一脉相承的「软硬结合」
AI 科技评论:你现在做的寒武纪芯片是中科院计算所的项目,跟计算所的其他项目如曙光超算、龙芯之间有什么样的传承关系或者演进过程呢?
陈云霁:传承关系很长。曙光董事长李国杰院士(也是中科院计算所前所长)80 年代在美国读博那会开始,已经在做人工智能与计算机体系结构的交叉研究,而且分别在这两个领域的顶级会议上发表过文章。
AI 科技评论:当年李院士被称为「Paper Machine」。
陈云霁:我听过这个传说。当时李院士可能主要在做基础研究,不像回国后可以把研究工作做成产业。后来李院士回国后,带的第一个学生叫姚新,他也是我的弟弟陈天石的导师。李院士带姚新做人工智能算法的时间复杂度分析,后来我的弟弟陈天石去念姚新老师和陈国良老师的研究生,第一个任务也是做人工智能算法的时间复杂度分析。
AI 科技评论:那是在什么时候?
陈云霁:2005 年,这一支的脉络就这么传承了下来。至于另一支脉络是在李院士担任计算所所长时,领导了我的导师胡伟武做龙芯 CPU,我相当于从这一支脉络传承了下来。直到 08 年,这两支脉络才重新结合,重心放在人工智能与机体结构的交叉研究上。
回过头来看,计算所会做人工智能芯片是有其必然性的,除了传承的过程,还有一点是,上世纪 80、90 年代的国家科委(如今的科技部)成立了国家智能计算机研究开发中心,当时依托在我们的计算所,由李国杰院士(后来为孙凝晖老师)负责管理,这也就是说研究所早在 90 年代初、80 年代末便承担了智能计算机的研发任务,虽然在过程中任务可能中断过,但从某种意义上说也是研究所在人工智能领域的任务循环。
AI 科技评论:从当年的智能计算机到当下的人工智能芯片,你觉得两者之间存在什么样的联系?
陈云霁:我觉得更多是思想和工作方法上的传承。从工作方法的角度来说,我们研究所的特点是无论做什么都会有看得见摸得着的系统,而且这个成品往往是「软硬结合」的。即使是现在,我们研究所出的研究依然保留着这个特色。
AI 科技评论:刚刚你提到姚新老师那支脉络的研究更倾向于「软」,而你这支脉络的研究更倾向于「硬」,因此形成了「软硬结合」的研究风格,这个风格一直延续到寒武纪神经智能芯片的开发上?
陈云霁:实际过程可能要稍微复杂一些,我们是想把「软」的人工智能算法与「硬」的芯片结合起来,所以一开始先用人工智能算法来指导芯片的设计,事成后,再反过来用芯片的设计思路来指导并完善人工智能算法,也就是我们的人工智能芯片。
AI 科技评论:两者在执行上有没有时间分界点?
陈云霁:这个没有太明确的分界点,因为我们所做的实际上是将两者进行捏合,肯定会有一方是主一方是从,我们颠过来倒过去的都尝试过,可以确定的是我们一开始先利用算法来做通用 CPU 的设计。
寒武纪的「破局」
AI 科技评论:人工智能在 2008 年还属于比较冷门的领域,当时你们怎么会想到做人工智能算法与芯片方面的结合?
陈云霁:主要是基于两方面的考虑。从初心的角度来看,人工智能在当时确实比较冷门,大家都觉得是一件离自身较遥远的事情,但是对我们而言,它却是计算机领域里最具有吸引力的课题,如果我们今天要吸引一名小孩投身科学领域成为计算机科学家,那么造出跟人一样聪明的机器人对小孩来说绝对是个很有吸引力的课题,这也是我们的工作初心;从资源的角度来看,我跟弟弟陈天石擅长的领域正好比较互补,两人又同时对彼此的工作比较认可,所以有进一步合作的意愿,这是比较难得的,换一个人,如果在自身领域做得比较好的情况下,一般不会愿意跨领域去冒险,尤其是在 2008 年人工智能还比较冷门的时候。
AI 科技评论:寒武纪芯片第一次获得大范围关注应该是在 2014、2015 年左右。
陈云霁:应该是在 2014 年的时候,当时我们获得 ASPLOS 的最佳论文奖,这是亚洲地区第一次在计算机体系结构的顶级会议上获奖。我们的工作在 2014 年以前的接受度其实并不高,跟现在的热闹相比,当时更多的是一种孤独的感觉。
AI 科技评论:中国的计算机体系结构研究在 2014 年以前是什么样的?
陈云霁:我们国家在 2014 年以前也有不少做得不错的工作,但如果从实际造出机器来看,当时国内公认的机构有三家:计算所、江南所以及国防科大;如果从基础研究的角度来看,清华、华工、哈工大、北航、中科大这些都做得很不错。
AI 科技评论:国内的早期计算机体系结构研究未能形成突破的局限点是什么?
陈云霁:其实突破还是有很多的。只是回到通用 CPU 的问题上,毕竟美国已经做了将近 40、50 年,比如英特尔公司是在六几年成立的,虽然一开始做的是存储相关的芯片,但至今起码也有 40 年的时间。要想在一个别人已经做了 40 年的领域上有所突破,难度还是比较大的,更多时候我们还得不停补短板。
AI 科技评论:寒武纪获得阿里的投资后有什么样的变化?阿里提供了什么样的帮助?
陈云霁:这块我不是特别了解,因为这属于寒武纪公司运营层面的事情。我每次都要一再跟人解释,我其实只是计算所的一名研究员,并未参与寒武纪公司的运营决策,是一名不折不扣的三无人员——没钱、没股份、没职位。但由于我是最早做这个研究的,因此很多人会误以为我是寒武纪公司的创始人,这个说法并不准确,我只是寒武纪芯片研究的创始人,从公司层面来说,我连普通员工都不是。
AI 科技评论:如何看待计算所与寒武纪公司之间的关系?
陈云霁:从某种意义上来说,计算所与寒武纪公司之间存在一种有一定耦合度但不完全一致的关系,因为计算所更擅长做从 0 到 1 的事情,但对于公司来说,从 1 到 10、到 100、到 1000、到 1 万甚至到 1 亿,才是它们更擅长的东西。计算所更偏重实现技术原理上的突破,而公司更偏重将产品与客户需求进行结合,做出更具有市场价值的产品。
一个好的基础研究者,一定是一个孤独的人
AI 科技评论:近些年人工智能领域有这么一个现象,就是学界的基础研究缺少来自工业界资源的支撑,导致研究不够「接地气」,因此不少学界研究人员选择到工业界发展,您的身边有出现类似的情况吗?
陈云霁:我的弟弟陈天石从某种意义上来说就是走的这个模式,更多地负责公司运营和产品打造层面的事情,而不是技术研究。但对我而言,我还是更愿意留在研究所里继续做研究,这两者各有各的乐趣,我跟陈天石也有各自不同的兴趣爱好。另外还有一点是,如果他做得足够出彩,我可以为他感到骄傲,就不一定非得自己投身到这件事情上去。我觉得科学研究对我而言已足够有挑战性,也能给我带来很多的成就感,所以我更愿意继续做这一块事情。目前人工智能领域的研究人员可以跟工业界快速进行切换,我觉得其实是一件好事,但肯定也要有一批人长期坚持做一些具有前瞻性的研究。
AI 科技评论:据了解,你在大学时期的兴趣爱好比较广泛,比如打游戏,而且有报道说你曾经从游戏中获得关于人工智能研究的灵感。
陈云霁:游戏本身确实给我的大学时代带来很多乐趣,让我打从心底认为计算机是个很有意思的东西,但如果说到具体的科研思路,更多还是从科学的实验和冥想上获得的。当然,如果有一天我们的研究能够对游戏的发展起到一定的作用,我觉得也挺好的,相当于将兴趣和职业进行了结合,然而目前可能还没做到。
AI 科技评论:很多人对计算机产生兴趣,可能都是从游戏开始。
陈云霁:没错,而且人工智能未来在游戏上的应用也会比较广,比如你在游戏里缺少对手时,系统可以给你匹配一个虚拟主体,这个应用让我觉得非常有意思。
AI 科技评论:学界也有很多论文在写如何组织机器打游戏。
陈云霁:我看谷歌、Open AI、阿里包括中国科学院都做过相关研究,比如通过人工智能的方法去玩星际争霸、dota 之类的游戏,长远来看这是一项很重要的研究。从产业链的角度来说,这个技术相当于在游戏世界创造了成千上万的虚拟玩家,即使对用户来说这些玩家可能 99% 都是假的,但是游戏体验还是变好了。
AI 科技评论:这一块研究与您目前的研究在未来会有交叉吗?
陈云霁:有可能。一方面是希望通过我们的芯片为游戏提供支撑,另一方面,我们也希望能够研究一些新的人工智能模式。这么说吧,目前的人工智能更多在做感知,主要想让机器看得见、听得懂,不过我觉得真正有意思的人工智能,应该是机器自己能够进行联想和推理,这就属于认知的层面。
AI 科技评论:刚才黄畅博士(地平线联合创始人)也提到了,未来 60% 的人工智能研发重点在推理。
陈云霁:这很有可能。这一块目前还不太成熟,我觉得研究人员有义务去做探索,至于那些已经成熟的东西,就交给工业界来做。目前人工智能有一个著名的方向叫 Multi Agent(多智体),这个理论主要强调如何在很多虚拟智能体的情况下做交互共生,让机器变得更聪明,这对游戏的未来发展而言至关重要。
AI 科技评论:当人工智能的发展从「感知」向「推理」转变,对于计算机体系结构的研究来说会有什么样的变化?
陈云霁:模式会变得很不一样。我读博期间做的很多工作其实都跟推理相关,按照传统的说法,人工智能可以分为三个流派:符号主义、行为主义和连接主义,最终可以让大家深刻感知到「智能」的主要体现在认知层面,而认知层面的一些核心方法基本上都源自于符号主义,不过这一块的研究目前算是处于停滞状态。另外,算法模式也会变得很不一样,比如推理领域目前最核心的算法叫 SAT(命题逻辑的可满足性判定),也被称为一个「NP 难」问题(指数时间复杂度问题),这说明目前最简单的推理问题,我们要想解决都还有很长的路要走。最近的 10 年、20 年,符号主义推理流派的相关研究进展不是很大,这也提醒我们这些做基础研究的人,要多多关注这块内容。
AI 科技评论:应该如何做好基础研究?
陈云霁:我觉得如果要做一个好的基础研究者,你一定是一个很孤独的人。2008 年我们开始智能和芯片交叉研究时候,我们很孤独。今天我们的论文现在被全世界上百个研究机构,包括哈佛、斯坦福、MIT、伯克利、英特尔、惠普、IBM 等,大规模的进行跟踪和应用,甚至写进了教科书里,有那么多人在做相关的研究,我们可能已经不再感觉孤独了,这也意味着我们应该将手头上的事情交棒给企业去做,然后继续去看一些比较新的东西。当然,深度学习处理器我已经做了这么久,未来工程开发肯定还会继续做,只是接下来基础研究确实要把更多的目光放在一些新方向上。
雷锋网 AI 科技评论