雷锋网按:本文根据高文院士今天上午在 CNCC 2016 上所做的大会特邀报告《人工智能--螺旋上升的60年》编辑整理而来,在未改变原意的基础上略有删减。
高文,北京大学信息科学技术学院教授。中国工程院院士、ACM/IEEE Fellow。1991年获日本东京大学电子工程学博士。曾任国家八六三计划智能计算机主题专家组成员、组长,973项目首席科学家。曾任中国科学院计算技术研究所所长、中国科学技术大学副校长、中国科学院研究生院常务副院长。曾任第四届、第五届国务院学位委员会计算机科学技术学科评议组成员、计算机学报主编,曾任或现任IEEE T-MM、IEEE T-CSVT、SPIC、JVCIR、IEEE T-IP编委等。是第十届、十一届、十二届全国政协委员。目前兼任国家自然科学基金委员会副主任、中国计算机学会理事长、全国信息技术标准化技术委员会多媒体技术分委员会主任委员、IEEE 1857(AVS)标准工作组组长、数字音视频编解码技术标准(AVS)工作组组长。
高文院士作为2016中国计算机大会特邀讲者发表报告《人工智能--螺旋上升的60年》
电子计算机的发明不仅大大改变了人们的工作方式,同时也极大改变了人类的学习、生活和工作方式。计算机科学研究的终极目标之一是实现与人类智能水平相当甚至更高的智能—人工智能。经过60年的研究,人工智能经历了起起伏伏,呈螺旋式发展态势。近几年由于深度学习的贡献,人工智能到达了一个新的顶峰。
人工智能三大派别
人工智能领域中关于派别部分,先说两个比较重要的派别,它们分别是
符号主义(逻辑主义)
连接主义
符号主义
主要内容是关于符号计算、演算和逻辑推理,用演算和推理的办法来证明。比如说像机器证明就是符号主义。
连接主义
连接主义也就是我们今天大家所说的非常红火的神经网络、神经元网络、深度学习,这些都是连接主义。
行为主义
其实第三个主义我们也不能忽略,但目前提及较少,叫行为主义。目前中国人工智能学会,还有一个中国自动化学会,他们也在做人工智能相关内容。如果提及派别的话,很容易联想到行为主义,其实是从控制界衍生出来的。
智能
提到人工智能,离不开智能的概念。通常我们说的的智力其实是智能,人类作为高级动物,区别于其他动物最本质的特征,就是人是有智能的。那么,我们说的智能是指什么呢?
有一类定义叫做智力三因素,其将智力分为是
成分智力
经验智力
情境智力
成分智力
指思维和对问题解决所依赖的心理过程,成分智力和受教育程度直接相关,或者正相关。
经验智力
经验智力其实它和受教育程度并不直接相关,有的人没有受过高等教育,同样可以有非常多的经验智力。
情境智力
情境智力也就是我们经常说的一个人的情商,即个人根据环境的调整所发挥出来的水平表现,这叫情境智力。
人工智能
现在我们知道了人智力的三个方面,那么人工智能就需要在这三个方面都得到良好的发展。
目前很显然并没有实现,我们现在说的深度学习、神经网络,其更多的是经验智力,成分智力和情境智力都远远不行。
人工智能我们说它是一种机器智能,是由机器来仿真或者来模拟人智能的系统或者学科。人工智能的研究实际上包括很多了,包括推理、知识、规划、学习、交流、感知、移动、操作等,这些是我们做人工智能研究基本的东西。
多元智能理论
如果把智能再细分一下,其实涉及很多方面。有一种理论是哈佛大学心理学家给出的,其给出定义把人类智能称为多元智能。其中多元智能涉及到至少9个方面,包括
逻辑方面的能力
语言文字方面的能力
空间改革的能力
音乐能力
肢体运作能力
内省的能力
人际关系能力
自然探索能力
图形图像理解的能力
这9个方面实际上表明智能可以细分到这么多的层次。
现在有很多讨论说,很快人工智能大概在10年、15年、20年就会超过人类。但是按照这个来分析,我们现在做的远远还不够。
人工智能之父
说到人工智能,有一位先生我们不能不提及,他就是人工智能的Founder——图灵(Alan Turing)。他既是计算机之父,也是人工智能之父。目前我们用来判断机器是否具有智能的测试就是他提出的,图灵实际上是我们这个领域的开山鼻祖。
图灵奖
图灵奖到目前已经授予了60多位科学家,在这之中有8位科学家是做人工智能的。
上图列举的就是这8位科学家,举例来说MIT教授Minsky Marvin,最早的连接主义就是他提出的,之后称连接主义不行的观点也同样是他提出的,他是一名非常伟大的人工智能学家。
McCarthy、Newll、Simon、Feigenbaum他们几位都是非常典型的符号主义代表,在他们的推动下包括最早先的机器证明、人工智能、通用人工智能机、知识工程,基本上都是他们在几位亲自推动下进步的。
另外一位Reddy主要是做语音识别的,他也是李开复、沈向阳的老师。他授奖的领域是大规模人工智能,实际上他是做多媒体的。
另外两位中Valiant是2010年获奖(机器学习理论),Pearl是2011年获奖(概率计算和因果推理),这两位昨天在周志华教授在介绍机器学习的时候也有专门提到过,他们的工作是未来人工智能的重点走向。
人工智能起源
1956年达特茅斯会议花了2个月的时间讨论人工智能问题,最后形成了我们所说的人工智能领域。在达特茅斯会议参会十几个参会人员中,有几个人都获得了图灵奖。
在人工智能这60年中,其实可以说是经过了许多起起伏伏。
人工智能第一次浪潮(1956-1976)
第一次浪潮是1956年到1976年,这二十年间主要是符号主义、推理、专家系统等领域发展很快。
当时这个领域做的最好是斯坦福大学,后来人工智能有关的这些获得诺贝尔奖获得者多数与斯坦福大学有关。斯坦福大学对人工智能贡献非常大,不过后来卡耐基大学(CMU)也发展的很快。另外MIT(Minsky教授)以及IBM、哈佛大学也都做出了许多非常不错的工作。
当时大家对人工智能非常看好,非常热。
人工智能初期著名预言
1958年,在人工智能诞生两年之后,当时有两位大师(Simon与Newell)提出了一个预言。当时这个预言很有名,其预言十年之内很多事情人工智能都能解决。比如说
十年内战胜国际象棋冠军
十年内发现和证明有意义的数学理论
十年内能谱写优美的乐趣
十年内能实现大多数的心理学理论
其中,国际象棋冠军这个早已实现,数学定理也实现了。但是另外两个到现在为止没有实现,这个可以说是过于乐观了。
人工智能的优秀研究者
人工智能第一次浪潮时期主要进展
人工智能第一个浪潮时期主要是符号主义、机器证明、人工智能逻辑语言进步比较快,当时最大的一个成果是专家系统、知识工程。
人工智能第一次反思
但是20年以后,大家当时设计的理想目标很多都没有实现,所以由此进入第一个低潮、冰河期。在这次反思中,很多大家认为可以做到的实际上没有做到。所有很多人开始疑惑这个领域是否真的有这么厉害,开始进行反思。再加上当时两面都受挫,其中
知识工程方面很多设定的远大目标实现起来都困难重重
连接主义则是MInsky发表了文章《K-lines: A Theory of Memory》基本上否定了神经网络大规模学习的能力
由于这篇文章影响,符号主义和连接主义基本可以说是从此消沉了。
人工智能第二次浪潮(1976-2006)
从1976年到2006年可以称作人工智能的第二次浪潮。在这一次浪潮中符号主义没有再起来,但是连接主义起来了。这中间包括几个里程碑式的工作,其中Minsky先生是连接主义这个领域比较典型的代表。
人工智能的优秀研究者
Marvin Minsky
自组织网络
在连结主义里面有各种各样的神经元网络,举例来说上图中的自组织网络
自组织网络经过训练可以在非监督状态下进行学习,得到分类的结果。
感知机(Perceptron)
上图是最早期感知机的模式,实际上它也是最简单的神经元网络。
误差反传网络(Back Propagation Net)
上图是1986年提出的一个两层神经元网络(BP网络),这个工作可以说是整个人工智能浪潮的奠基性工作。
神经网络相关从业者都知道,在训练的时候给出一个样本,有输入、输出。给定一个输入,输出可能是对的,也可能是错的。对的没问题,错了怎么办?如何进行调整?
这在以前是很难的,之前虽然有很多经验去进行调整,但是那个调整是否收敛?一直没有证明。
BP网络的出现第一次证明,神经元网络可以通过BP网络使得这个网络可以收敛,在这个基础上就能实现学习了。如果神经网络的学习不能收敛,那就不能使用用。
人工智能第三次浪潮(2006至今)
在2006年众所周知,Geoffrey Hinton联合Yann LeCun、Yoshua Bengio发表了图中所提到的论文,论文发表后,大家普遍认为神经元网络可以解决很多问题。
人工智能第三次浪潮特点
虽然深度学习是从2010年开始变得热门,但2006的文章可以说是直接推动了2010年深度学习一路发展到今天的高度。
2006年第三次浪潮中第一次有了深度学习,在这里要提到有两个因素促成了深度学习的成功:
一个是硬件的进步
硬件越来越便宜,计算能力越来越强。
第二个是模型和参数调整技巧的进步
在以前做一个几层的神经元网络可能还问题不大,但是一训练可能就要很长时间。
举例来说20年前,汉字识别需要收集很多汉字识别的样本。以前在机场到处让人写字,然后计算机扫描进去,再进行训练。那时候训练需要多长时间呢?如果放十几台机器的话要1到2个月,且收敛速度很慢。那时候只有4、5层,但现在100多层或者更多,可能几十个小时就可以训练出来了。
人工智能未来的基础理论
往下到底做什么?这是我的一些判断。
首先我们不能说到现在为止进步不大,进步很大,但是在整体来说还是非常小的进步。所以,我们需要有一些决定性的、革命性的工作,即非确定性的信息处理和新的机器学习方法。
在这里实际上要以知识处理为中心,要把前面的符号主义和连接主义这两者结合起来,在这之中里面有两个先驱者已经获得了图灵奖。
最近和NSF人接触以后,发现美国现在对于深度学习这件事争议非常大。目前NSF对于基础理论的研究是仍然支持的,但是所有的应用领域的研究一律不再进行支持了。
这个给了我们一个信号,也许几年以后真的会到沉寂期。
人工智能60的思考
人的知识可以分成四类,从两个象限来看。
一个是可统计、不可统计。
人有些知识,有些可以去统计,有些你没办法统计。
另一个是可证明(可推理),与不可证明(不可推理)。
我们将知识放在两个维度的空间上,横向方向上只要是可推理的,我们可以通过机器学习的方法,最终完成这个推理。
凡是可统计的,在纵向方向可以通过大数据、统计的办法得到一个好的结果。
也就是说,要么通过机器学习的办法,要么通过统计的办法,都可以解决一类的问题。
我们的知识实际上是分成四类
We know what we know
We know what we don't know
We don't know what we know
We don't know what we don't know
这四类知识里,我们现在对于可统计可推理的部分,原则上我们都可以找到答案,不管是用机器学习还是神经网络的方法。
对那些可推理不可统计的部分,可以用举一反三的办法。
可统计不可推理的部分可以采用模糊识别的方法。
不可统计不可推理的部分就得靠顿悟了。这类知识不是任何人都可以得到,只有极少数人可能得到。
人工智能时代是否到来
今年是人工智能60周年,目前来看现在人工智能时代既到来了,也没有到来。
人工智能离人类智能差距
与多元智能的定义对比,我们现在九个领域中,其中
逻辑、语言文字、图形图像方面做的比较好
空间、音乐与肢体运作方面则马马虎虎
内省、人际以及自然探索方面完全还不行
结合之前的内容来看,我认为
人工智能1.0是在可统计可推理的部分取得一定的成果。
人工智能2.0是在1.0的基础上向不可统计不可推理的部分区域推进。
人工智能3.0,大概最多到4.0,后面一定会有相当一部分是难以做到的(顿悟),但是这也是今后发展的方向。