10月中旬,乌镇智库联合网易科技、网易智能发布了《乌镇指数:全球人工智能发展报告(2016)》系列报告。报告对人工智能中的一系列热点问题进行了详细的剖析,包括企业分布规模、投融资情况、研究成果、细分领域等。
特别是在研究成果部分,在报告中我们有注意到:
在人工智能方向,全球排名TOP50的大学中没有一所中国大陆大学。
这是为什么呢?
报告中指出这份人工智能大学排名是基于学术与影响力两方面来进行排布的,其中:
学术包括学校人工智能领域发表论文数量、单论文质量、论文被引用数三个指标。
影响力包括人工智能领域杰出校友数,维基百科人工智能方向被引用数两个指标。
查阅整份报告之后,我们发现人工智能全球Top50的大学几乎都是来自北美、英国以及其他欧洲地区的大学,唯一上榜的亚洲大学分别是排名37的台湾大学、排名47的东京大学、以及排名50的新加坡国立大学。为什么中国大陆以及香港的高校都没有上榜?对此我们对多方进行了询问。
我们首先请教了来自香港理工大学的曲晓峰,他表示:
排行榜需要完整地看,各项指标的设置到设计指标的人,都要考虑进去。
首先,这个榜单针对的是人工智能,人工智能的定义其实还是很模糊的,哪些领域、哪些指标需要纳入进来作考虑是比较模糊的。尤其,杰出校友、成功人士多是经历广泛,难以归入某校。
另外,论文数量和引用,这个指标非常容易统计,但不够有力。美国大学发表英文论文非常容易,这个就容易做得很高。台湾大学、东京大学、新加坡国立大学都是亚洲的大学,但国际化做得比较好,所以名次也就比较好。
再一个是国防问题。国内所有顶尖大学,都有保密的问题,我们航空航天的科研,是完全对外保密的。而上榜地区绝大部分是对美透明的,所以那些学术成果,对英美是完全开放的。
还有一个可能的因素,就是论文引用数的提升,需要时间。
我主要的感想:
一方面是,总体排名上,中国大陆和香港大学,不至于榜单显示得这么不堪。榜单所选取的参数,明显滞后于现状,而且由于这些参数内生的特性,还将继续滞后一段时间;
另一方面是,设计的指标,为了便于统计使用的都是容易获取的指标。例如专利数、论文数、引用数等;专利的问题,欧美日本的习惯是,一个专利要在多个地区注册,因为不同的国家和地区,专利不通用,谁先抢注算谁的。我国除了少数几个国际化的公司,大多数中小公司和科研院所还没有这方面的习惯。
最后,即使是现在这个状况,也很明显,中国大陆和香港都是在迅速赶超,只不过对于这样一个参考参数明显滞后的榜单而言,要想显示出当前现状,它的参数至少落后了几年的时间。举个例子,PCA 这种非常简单的基础算法,是 MIT 八十年代用在人脸识别上的,现在已经没人这么用了,但只要提到人脸识别,总还是要引用一下。这造成的引用数还会持续的虚增好一段时间。但了解现状的人都知道 MIT 对人脸识别,早已经失去兴趣了。
我们也咨询了来自清华大学的徐魁:
我觉得这种评价方式是不准确的,这种评价方式有将以往的研究成果的权重给的很高倾向,也就是说这个指标只代表了大陆过去在人工智能方面的成绩。
中国最近几年在深度学习、计算机视觉、语音识别、以及自然语言处理等方面取得了成就是非常可观的,而这个影响力现在在整个人工智能领域的全范围中目前体现不出来。
另外来自新加坡国立大学的李长胜表示:
我觉得我们国家在人工智能的创新性理论方面和国外相比,尤其是美国还有一定的差距。虽然在应用方面我们并不比别人差,但是研发能力相对较弱,真正有影响力的学术成果较少。
另外我觉得国外在基础研究领域的支持做的比较好,这样使很多研究者能够在某一个方向上坚持做下去,会有较多的创新性成果。
此外,一位来自北京大学人工智能相关专业的同学表示:
感觉是几方面原因吧:
1、国内高校CS的研究普遍是在追赶美国高校的步伐,这跟其他学科的研究类似;
2、深度学习需要大量硬件设备的支持,国内高校条件经费相对欠缺;
3、人才的缺乏,CS领域顶尖人才近期还是会留在美国做tenure或是进入工业界,国内吸引力不足。
从各方评论来看,大家对于这种以论文数量、单论文质量、论文被引用数、人工智能领域杰出校友数、维基百科人工智能方向被引用数来进行人工智能大学排名是持有不同看法的。
综合各方意见,AI科技评论君为大家总结如下:
榜单中使用的评价方法将以往的研究成果权重给的较高,很多经典论文(举例:Hinton、Lecun、Bengio等人的经典论文)可能会被多次引用,增加其权重占比,从而影响了排名。
榜单中评价指标的设定选取得是易于统计的指标,这使得相关数据容易获取但是其评价力度不够。
我们国家之前在人工智能的创新性理论方面和国外相比,尤其是美国还有一定的差距。但是中国最近几年在深度学习、计算机视觉、语音识别、以及自然语言处理等方面取得了成就是非常可观的,这个影响力现在在整个人工智能领域的全范围中目前还体现不出来。