自 2006 年深度学习算法被提出、2012 年开始大数据爆发式增长以来,人工智能领域的各项技术分支也在不断发展,人工智能相关的产业化落地方案和商业化模式逐渐清晰,人工智能的细分领域技术分支的代表性企业及其竞争格局也逐渐形成。
近日,中国科学院大数据挖掘与知识管理重点实验室发布了《 2019 年人工智能发展白皮书》, 对人工智能关键技术(计算机视觉技术、自然语言处理技术、跨媒体分析推理技术、智适应学习技术、群体智能技术、自主无人系统技术、智能芯片技术、脑机接口技术等)、人工智能典型应用产业与场景(安防、金融、零售、交通、教育、医疗、制造、健康等)做出了梳理。
并根据调研数据重点分析了人工智能各个细分领域的关键技术和产业应用,并推出全球人工智能企业 TOP20 榜单,微软、谷歌、脸书、百度位列排行榜前列。
白皮书显示,中国 AI 正在全球不断提升影响力,成为主导 AI 创新落地的有力竞争者。在人工智能向各行各业渗透的过程中,主要的人工智能技术还掌握在大型科技公司,而人工智能开放创新平台让 AI 普惠到更多公司和用户,对于推动全行业的发展、加速人工智能社会的建设都具有重要推动价值。
如果您想获得本报告的全文 pdf,请在雷锋网微信(leiphone-sz)回复关键词“319报告”提取。
来源:中国科学院大数据挖掘与知识管理重点实验室《2019 年人工智能发展白皮书》
1、计算机视觉技术
计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和 测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因是 2015 年基于深度学习的计算机视觉算法在 ImageNet 数据库上的识别准确率首次超过人类,同年 Google 也开源了自己的深度学习算法。计算机视觉系统的主要功能有图像获取、预处理、特征提取、检测/分割和高级处理。
2、自然语言处理技术
自然语言处理(Natural Language Processing)是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科,也是一门横跨语言学、计算 机科学、数学等领域的交叉学科。自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、 分析、理解、生成等的操作和加工。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。 可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及 两个流程,包括自然语言理解和自然语言生成,自然语言理解是让计算机把输入的语言变成有意思的符号和关系,然后根据目的再处理;自然语言生成则是把计算机数据转化为自然语言。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。
自然语言处理的研究可以分为基础性研究和应用性研究两部分,语音和文本是两类研究的重点。基础性研究主要涉及语言学、数学、计算机学科等领域,相对应的技术有消除歧义、语法形式化等。应用性研究则主要集中在一些应用自然语言处理的领域,例如信息检索、文本分类、机器翻译等。由于我国基础理论即 机器翻译的研究起步较早,且基础理论研究是任何应用的理论基础,所以语法、句法、语义分析等基础性研究历来是研究的重点,而且随着互联网网络技术的 发展,智能检索类研究近年来也逐渐升温。近年来,计算机视觉在产业界和学术界不断取得突破,取得代表性成果的组织有谷歌、阿里、百度、搜狗、科大讯 飞等公司,清华大学、Allen 人工智能研究所等高校/研究所以及其他多种类型的组织或个人。
3、跨媒体分析推理技术
以往的媒体信息处理模型往往只针对某种单一形式的媒体数据进行推理分析,比如图像识别、语音识别、文本识别等,而越来越多的任务需要像人一样能够协 同综合处理多种形式(文本、音频、视频、图像等)的信息,这就是跨媒体分析与推理。跨媒体是一个比较广义的概念,既表现为包括网络文本、图像、音频、 视频等复杂媒体对象混合并存,又表现为各类媒体对象形成复杂的关联关系和组织结构,还表现在具有不同模态的媒体对象跨越媒介或平台高度交互融合。
通过“跨媒体”能从各自的侧面表达相同的语义信息,能比单一的媒体对象及其特定的模态更加全面地反映特定的内容信息。相同的内容信息跨越各类媒体对象交叉传播与整合,只有对这些多模态媒体进行融合分析,才能尽可能全面、正确地理解这种跨媒体综合体所蕴涵的内容信息。跨媒体分析推理技术主要包括跨媒体检索、跨媒体推理、跨媒体存储几个研究范畴,可应用于网络内容监管、舆情分析、信息检索、智慧医疗、自动驾驶、智能穿戴设备等场景。
4、智适应学习技术
作为教育领域最具突破性的技术,智适应学习技术 ( Intelligent Adaptive Learning) 模拟了老师对学生一对一教学的过程,赋予了学习系统个性化教学的能力和传统千人一面的教学方式相比,智适应学习系统带给了学生个性化的学习体 验,提升了学生的学习投入度和学习效率。采用了智适应学习技术的学习系统能够针对学生的具体学习情况提供个性化学习解决方案,包括定位学生的知识漏洞、 持续性地评估学生的学习能力水平和知识状态、实时动态提供个性化学习内容。智适应学习技术让教育领域一直困扰的质 量、成本、可获取性三大矛盾因素变成了历史。
智适应学习技术体系包括知识状态诊断、能力水平评测和学习内容推荐等。知识状态诊断技术是指通过少量试题,在较短时间精准诊断出学生的知识漏洞,这一技术较常用的算法是知识空间理论。能力水平评测技术是指评测出学生的知识掌握情况,分析出学生得到提升的学习能力、学习思维和学习方法,这一技术较常用的算法是项目反应理论、贝叶斯知识追踪。学习内容推荐技术是指依据学生学习情况,推荐合适的学习内容,这一技术较常用的算法是机器学习算法,该算法以学生的所有信息为输入,输出是学生接下来需要学习的内容,达到最大化学习效率的目的。
目前在全球已有一亿多学生在使用智适应学习系统,覆盖了各个年龄段,从小学、初中、高中,到高等教育、职业教育和成人教育,已应用到文、理、工、医等不同学科领域。
5、 群体智能技术
群体智能(collective intelligence)也称集体智能、群智。群体智能是一种共享的智能,是集结众人的意见进而转化为决策的一种过程,用来对单一个体做出随机性决策的风险。对群体智能的研究,实际上可以被认为是一个属于社会学、商业、计算机科学、大众传媒和大众行为的分支学科,研究从夸克层次到细菌、植物、动物以及人类社会层次的群体行为的一个领域。
群体智能最早源于对以蚂蚁、蜜蜂等为代表的社会性昆虫的群体行为的研究,自1991年意大利学者Dorigo提出蚁群优化(Ant Colony Optimization, ACO)理论开始,群体智能作为一个理论被正式提出,并逐渐吸引了大批学者的关注,从而掀起了研究高潮。1995年,Kennedy 等学者提出粒子群优化算法(Particle Swarm Optimization, PSO),此后群体智能研究迅速展开。目前群体智能的研究主要包括智能蚁群算法和粒子群算法,智能蚁群算法主要包括蚁群优化算法、蚁群聚类算法和多机器人协同合作系统。其中,蚁群优化算法和粒子群优化算法在求解实际问题时应用最为广泛。
6、 自主无人系统技术
自主无人系统是能够通过先进的技术进行操作或管理而不需要人工干预的系统,是由机械、控制、计算机、通信、材料等多种技术融合而成的复杂系统。自主无人系统可应用到无人驾驶车辆、无人机、服务型机器人、空间机器人、海洋机器人、无人车间、智能工厂等场景中,并实现降本增效的作用。
7、 智能芯片技术
近年来我国学术界和产业界都加大了对芯片技术的研发力度,国内智能计算芯片技术不断取得新的成果。一些基于传统计算架构的芯片和各种软硬件加速方案相结合,在一些人工智能应用场景下都取得了巨大成功,但由于市场需求的多样性,很难有任何单一的设计和方法能够很好地适用于各类情况。因此,学术界和产业界涌现出多种专门针对人工智能应用的新颖设计和方法,覆盖了从半导体材料、器件、电路到体系结构的各个层次。
8、 脑机接口技术
脑机接口(Brain-Computer Interface,BCI)是在人或动物脑(或者脑细胞的培养物)与外部设备间建立的直接连接通路。通过单向脑机接口技术,计算机可以接受脑传来的命令,或者发送信号到脑,但不能同时发送和接收信号。而双向脑机接口允许脑和外部设备间的双向信息交换。2013年,自美国首次宣布启动“脑计划”以来,欧洲、日本、韩国等陆续参与“脑科技”竞赛项目,据已公开数据表明,全球在脑机接口相关领域的研发支持已经超过200亿美元。
在人工智能技术向各行各业渗透的过程中,不同产品由于使用场景复杂度的不同、技术发展水平的不同,而导致其成熟度也不同。比如,教育和音响行业的核心环节已有成熟产品,技术成熟度和用户心理接受度都较高;个人助理和医疗行业在核心环节已出现试验性的初步成熟产品,但由于场景复杂,涉及个人隐私和生命健康问题,当前用户心理接受度较低;自动驾驶和咨询行业在核心环节则尚未出现成熟产品,无论是技术方面还是用户心理接受度方面都还没有达到足够成熟的程度。
在人工智能技术向各行各业渗透的过程中,安防和金融行业的人工智能使用率最高,零售、交通、教育、医疗、制造、健康行业次之。安防行业一直围绕着视频监控在不断改革升级,在政府的大力支持下,我国已建成集数据传输和控制与一体的自动化监控平台,随着计算机视觉技术出现突破,安防行业便迅速向智能化前进。金融行业拥有良好的数据积累,在自动化的工作流与相关技术的运用上有不错的成效,组织机构的战略与文化也较为先进,因此人工智能技术也得到了良好的应用。
零售行业在数据积累、人工智能应用基础、组织结构方面均有一定基础。交通行业则在组织基础与人工智能应用基础上优势明显,并已经开始布局自动驾驶技术。教育行业的数据积累虽然薄弱,但行业整体对人工智能持重点关注的态度,同时也开始在实际业务中结合人工智能技术,因此未来发展可期。医疗与健康行业拥有多年的医疗数据积累与流程化的数据使用过程,因此在数据与技术基础上有着很强的优势。制造行业虽然在组织机构上的基础相对薄弱,但拥有大量高质量的数据积累以及自动化的工作流,为人工智能技术的介入提供了良好的技术铺垫。
安防:安保、警务、治安、人车流监控等场景全面应用 。
金融:以智能风控为主,同时渗透支付、理赔、投研投顾等场景 。
零售:人工智能提升零售全流程运行效率,优化消费者体验 。
交通:人工智能应用到拥堵分析、路线优化、车辆调度、驾驶辅助等场景,有效改善交通问题 。
教育:由表及里,人工智能技术逐渐深入学习环节
医疗:从影像分析、辅助诊疗、健康管理等角度做好医患助手。
制造:助力生产制造优化,减少重复劳动,实现智能制造。
健康:降低健康管理成本,实现交互革命,增强人类功能。
虽然人工智能技术不断向众多行业和商业场景渗透,但目前人工智能的能力仍然不是像云计算一样可以随取随用的通用资源,主要的人工智能技术还掌握在大型科技公司和互联网巨头的手里,若能让人工智能普惠到更多公司和用户,人工智能社会的建设才会明显提速。在政府和大型公司的领跑下,越来越多的人工智能开放平台开始涌现出来。
2017-2018年,科技部等多部门经充分调研和论证,确定了五大国家新一代人工智能开放创新平台:分别依托百度、阿里云、腾讯、科大讯飞公司、商汤集团,建设自动驾驶、城市大脑、医疗影像、智能语音、智能视觉人工智能开放创新平台,并由科技部、发改委、财政部、教育部、工信部、中科院等15个部门构成的新一代人工智能发展规划推进办公室来推进项目、基地、人才的统筹布局。