作者 | 西西
编辑 | 陈彩娴
刚刚,斯坦福大学发布了著名的《2022年人工智能报告》(Artificial Intelligence Index Report 2021,以下简称「报告」),迅速在人工智能领域引起传阅。
报告链接:https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf
从2017年至今,斯坦福大学 AI Index 每年都会发布一份报告,由于数据详细、调查来源清晰、观点充实等等优点,在总结过去一年的 AI 发展上有着较为权威的发声,一向为读者关注。到今年,由李飞飞领导的 HAI 实验室领导,已是第五版。
除了原先的技术趋势分析,今年该报告还增加了对全球机器人的调查,以及25个国家与地区(不包含中国,所以此处不讨论)在 AI 层面的立法活动。
更值得注意的是,今年斯坦福的AI指数报告首次大篇幅地讨论了人工智能在现实生活中的落地问题,包括 AI 在经济发展中的角色,以及 AI 在落地推广过程中所引起的潜在伦理问题。
报告指出,一方面,外界对 AI 领域的投资比例在上升:与2020年(460亿美元)相比,2021年 AI 投资的资金增长了103%(965亿美元)。同时,AI 出现「物更美、价更廉」的特征,例如,自 2018 年以来,训练图像分类系统的成本降低了 63.6%,而训练效率却了 94.4%。
但另一方面,AI 在现实生活中的日益渗透也加剧了社会伦理的危机。因此,接下来,我们也许会看到,越来越多对 AI 的讨论不仅再局限于模型与算法的创新,或连接主义与符号主义孰劣孰优,而是:在人工智能时代全面来临之前,我们应该做好哪些「基建层面」的准备工作?
由于报告内容长达200多页,所以AI科技评论仅从中美对比的角度对报告进行了整理:
根据报告,从研究机构看,全球范围内高校对 AI 研究出版物的贡献比例最高,高达59.58%,而公司仅占 5.21%:
单就这一层面,美国的 AI 出版物中,高校比例不断下降,2021年占 57.63%,企业占 9.76%:
而中国的 AI 出版物中,高校比例不断上升,占比 60.24%,企业占比虽然也不断上升,但2021年仅占比 3.93%:
尽管中美关系紧张,但报告发现,在 2010 年到 2021 年期间,中美合作的AI论文数量在跨国合作论文数量排行中位居榜首,是第二名(中英合作)的2.7倍:
报告还对比了中国、欧盟&英国、与美国在过去12年的AI出版物占比,其中中国的数量一直保持第一,占比31.04%,其次是欧盟与英国(19.05%),美国为 13.67%:
在 AI 期刊论文的引用数上,中国的占比逐渐上升,2021年排名第一(27.84%),美国的被引用数则为 17.45%:
在 AI 会议上,中国的论文发表数量也是排名全球第一,占比 27.6%,而美国为 16.9%,位居第三:
尽管出版数量上中国占优势,但报告发现,美国在 AI 会议上的论文被引数最高,占比29.52%,中国则只有15.32%:
在AI存储库(如arXiv)出版物上,美国自2011年以来一直保持领先地位,2021年占比 32.52%,但中国也不甘落后,比例一直上升,2021年占比16.6%:
在AI存储库出版物的引用数上,美国在2021年也是位居第一,引用率高达 38.6%,而中国为 16.4%:
在人工智能专利的申请上,2021年中国申请了全球一半以上的人工智能专利(51.69%),美国则为 16.92%:
首先,在人才招聘一块,报告显示,中国香港在 AI 人才的招聘增长速度上位于全球第二,较 2016 年增长了 1.56 倍:
通过计算 2015 年至 2021 年期间 LinkedIn 用户在给定领域的自我添加技能的频率,报告发现,在AI 技能的渗透率上,印度的平均渗透率最高,其次是美国(2.24),而中国为 1.56,排名全球第四:
此外,在 AI 产业的投资上,美国的 AI 公司在获得总体私人投资上位居世界第一,约为 529 亿美元,而中国位居第二,为 172 亿美元,美国是中国的三倍:
而在2013年至2021年的私人投资总额上,美国投资总额为 1490 亿美元,中国投资总额为 619 亿美元:
值得注意的是,从 2013 年到 2021 年,美国对人工智能公司的私人投资是中国的两倍多,而中国本身是同期英国总投资的六倍左右。按地理区域划分,如图 4.2.6 所示,2020 年至 2021 年美国、中国和欧盟的投资均有所增长,其中美国分别领先中国和欧盟的 3.1 倍和 8.2 倍:
从 AI 公司的数量上看,2021 年,美国以 299 家公司领先,其次是中国,有 119 家:
在 AI 的采用率上,2021年采用率最高的是高科技/电信的产品和/或服务开发(45%),其次是金融服务的服务运营(40%), 高科技/电信(34%)和金融服务的风险职能(32%):
而采用的 AI 能力类型上,2021 年,嵌入率最高的是高科技/电信行业的自然语言文本理解(34%),其次是金融服务和汽车和装配行业的机器人流程自动化(33%)和金融服务的自然语言文本理解(32%):
那么,采用人工智能的风险可能有哪些?
报告称,55% 的受访者认为 2021 年最突出的 AI 应用风险是网络安全,其次是监管合规性(48%)、可解释性(41%)和个人隐私(41%):
报告还称,「尽管人工智能在全球范围内部署,许多研究人工智能伦理的论文还是集中在英语模型与数据集上」。
由于 AI 系统已被部署到世界各地,研究人员开始加大对 AI 与现实交互的关注度,尤其是 AI 落地可能带来的危害,例如带有种族歧视的人脸识别系统、带有性别歧视的简历筛选系统,以及经济收入歧视的 AI 临床工具等。
AI 模型在落地过程中展示出来的社会偏见,使研究者们增加了对研究 AI 伦理、公平与偏见的兴趣,并驱使相关从业者积极寻找解救措施。
如前所述,该报告还增加了对 AI 伦理的探讨。报告发现:
语言模型所展现出的「偏见」问题最明显,且新数据表明:语言模型的规模越大,在训练数据中反映出来的偏见也越普遍。比如,一个2021年开发的 2800 亿参数模型比 2018 年 1.17 亿参数的模型的毒性增加了 29%
自 2014 年以来,针对 AI 公平性与透明性的研究呈爆炸式增长,相关出版物增加了五倍,算法公平与偏见的研究逐渐成为主流研究课题,而且工业界在该方向的研究工作发表同比增加了 71%
多模态模型也呈现出多种多样的、创纪录的「偏见」,例如,关于 CLIP 的实验表明,黑人图像被错误分类为非人类的比率是其他种族的两倍以上
此外,报告指出,虽然全球范围内的研究者都对 AI 公平性、问责性与透明性的研究越发感兴趣,但在相关会议 FAccT 上,大多数的论文都由美国的研究人员撰写。从2020年到2021年,来自北美机构的论文比例从70.2%上升到75.4%:
与其他语言的事实检验数据集相比,英语数据集的比例最高,有 142 个,而非英语数据集只有35个(其中中文数据集只有5个):
这一点间接地讽刺了人工智能领域的中文研究者缺少对 AI 伦理的论文发表。换言之:较少中国研究者从事 AI 伦理层面的科研工作。那么,报告的观点是否有失偏颇呢?也许只能评论区见分晓。
在 AI 的落地研究上,如何缩小中美差距?谈谈你的看法。
参考链接:
https://aiindex.stanford.edu/report/
雷峰网(公众号:雷峰网)