雷锋网消息,9月7日,在全球学术界、产业界的领袖精英的见证之下,工信部第二届“绽放杯”5G应用征集大赛之珠海智慧城市专题赛暨2019岭南大数据国际论坛在珠海横琴国际会展中心隆重开幕。作为国际大数据、5G、智慧城市领域顶级活动,此次论坛规模相比去年再度升级,与会人数创新高,全球创新创业企业汇聚于此,诸多享誉国内外的院士专家作为嘉宾重磅亮相。
本次活动由珠海市工业和信息化局、珠海市科技创新局、珠海(国家)高新区管委会、珠海市人才工作领导小组、中国移动广东公司珠海分公司、广东广电网络珠海分公司、珠海华发集团、珠海城建集团、珠海市岭南大数据研究院等主办,广东城智科技有限公司、珠海市岭南大数据研究院联合协办,得到了工信部、珠海市人民政府、中国移动研究院、中国移动广东公司等大力支持。该活动吸引了来自全球5G、大数据、人工智能、物联网等领域顶级院士、专家和企业代表参会,旨在打造国内5G智慧城市领域高端学术交流峰会。雷锋网作为协办单位,深度参与本次活动。
欧洲科学院院士、上海交大AI研究院首席科学家徐雷发表了《人工智能科技对智慧城市未来的影响》的演讲。徐雷教授主要分享了自己对人工智能的看法,并简单探讨了智慧城市的话题。
他认为,人工智能从某种意义上来说可以从识别认知、形象思维和抽象思维三个维度来了解,而当今人工智能第三次浪潮的核心突破点是在识别认知方面。他提到,根据《自然》近期的一篇评论,在基础理论和算法创新层面,中国同英美尚且有五到十年差距。关于智慧城市,徐雷教授认为,我国智慧城市的发展应该结合不同城市的情况,毕竟每个城市的痛点和优势不同,而在 4G/5G 网络的支撑下,地理距离已经不再重要,每个城市也没有必要进行重复建设;从这个角度出发,我国应当大力发展智慧城市集群。
我的演讲题目内容分为两个部分:人工智能发展和智慧城市。
人工智能有没有定义?我们来看大脑,若从内在机制的角度看,看它整个结构,很复杂,基本上面对的是失败,这一次欧洲脑计划也基本上是失败了。从外在表现的角度看,目前主要有两个方向。一个刚才陈老师从认知科学研究与应用的角度。再一个就是从经典的计算机信息处理,可以泛泛地认为智能就是大脑的信息处理活动。
不过,现在最简单而常用的是图灵测试,就是说,若分不出是人和还是机器干的,机器就是有了智能,那么大概要多少?30%还是50%,有不同做法。但这样可能太泛了,所以我还想把各种各样的人工智能,稍微归纳一下,为此把1975年钱学森先生关于思维科学的一些思路拿过来,并整理修改推广一下。
人工智能有三个主要的部分。第一个俗称为“刷脸识别”,这个后头会讲,是这一波人工智能发展的主要突破点。
第二个,早在1975年,钱学森先生就认为,常用而重要的智能部分其实是在形象思维。而那时候,人工智能界主要都在研究抽象思维。粗略地讲,形象思维就是比较具象、根据关联性就具体模式或其映象进行的推断。而抽象思维则是根据逻辑、因果条理进行的推理,大概是这个状况。
很有意思,这两种不同方式,中国人和西方人正好分别擅长其一。中国文字基本是象形的,思维发展偏重形象思维,而西方文字抽象成符号,抽象到26个字母加标点符号,拼写组合成符号串,并包括A+B=C等数学抽象,注重相互关系、注重形式语法。实际上,图灵机以及后来的计算机就是基于对西方自然语言的简化,发展变成了当今的计算机能力,可以说几乎达到从这个角度模拟智力发展的顶峰,只不过通常已经不把它算进人工智能了。
而我们的古文是没有语法,没有标点。就是现在,至少要认3000个字,差不多才算懂中文。我们就没有发展到符号抽象的这一步。很有意思的是,西方其实按照历史(如果我是对的话,这方面不在行),大概5000年前古埃及的形象文字走向古希腊符号文字。 是什么促使它走向了这种抽象,而我们的文字却没有,值得从智能发展的角度去探讨。正是因为它高度的抽象,西方学者把抽象思维叫高级智能,高度抽象以后才有科学在那里生长发展。中国文字没有这种抽象,可能很大程度致使中国没有发展出科学。
解析确定若干独立的基本单元(如语文中字母符号集或数学体系中的公理),先是考虑它们两两之间的二元关系(如逻辑、因果、以及某种依赖关系),再像搭积块似的,按一定的规则或规律,循理择优,由底朝上逐步组合,搭出一个体系或世界来。它有利于抓住主要脉络,解释所看到的现实世界。但是,有限的基元数,有限的组合规则,只能描述相对简单的人工世界。如何从自然世界获得这些基元和规则,且自然事物的复杂性导致组合可能性的庞大,导致用抽象思维的方式针对“刷脸识别”这类智能,反而遇到很大困难。
而中国的学问是从整体开始,混沌分阴阳,阴阳和谐说其实就是一分为二的系统构成论,然后五行说就是定性描述这个系统的动力学,这两个学说,其实像西方科学一样,是经得起恒常律和普适律检验的,这里就不细说了。若往下再分,八卦就比较玄了。不管如何,这种从顶往下、具体具象的思维方式,正好与抽象思维的方式互补,反映了智能的两面,也反映了文化的两面,应该中西融合和谐发展,不应对立互打。
这次人工智能浪潮就是在形象思维的部分突破的,“耳聪目明“ 就是形象思维的基础。做法其实很简单,就是数学上完成一个X到Y的一个整体性的映射,用一个深度神经网络结构来实现。在目明的角度上大概超过了人,耳聪的角度上接近人。
大概是我们的文化偏好形象思维,也很巧了,不仅这次的推波助澜的引起主要发展都是华人,过去一路走来致力于推动“耳聪目明“,华人也是主角之一部分。
大家可能知道,Hinton团队在2006年发现深度学习网络可以显著改善识别性能后,就是微软的邓力,也是我的一个朋友,把Hinton请到微软,将语音识别显著推进。接着李飞飞搞image-net,建立超大规模的头像数据库,使刷脸识别大大推进, 导致工业界和资本的广泛介入“耳聪目明“行业。你再看这张图,我国目前的公司分布情况,基本上也主要在这一块。
这是人工智能的盘山式发展图,它是立体向上的。我们的机遇不是弯道超车,而是有机会实现跨越。还有,大家都觉得人工智能这次是第三次浪潮,其实不尽然。抽象思维发展到了冯诺依曼机以后,其实已经是机器模拟智能的巨大成功了,不过刻意不算它了。
再走到自然语言和视觉,受阻了,推不动了。但人工智能还在发展,热潮移到了另外一批人,走形象思维,攻“耳聪目明”。类似地,然后又转移到了再下一批人。尽管早在57年就有华人介入字符识别,主要是70年代中期到80年代中期,主攻“耳聪目明“的模式识别,开始了它第一个十年的发展期,头号领袖是左图的傅京孙先生(1930-85)。图上的另外五位百岁级已故院士,都是中国人工智能发展的先驱。左边另外两位是常迥先生和程民德先生,领导了中国模式识别的发展,建立了我国智能科学的第一批三个国家重点实验室,其中两个主攻模式识别与机器认知,并在我国学科设置上正式开出了模式识别的相关专业,近年来我国 “耳聪目明“方面的人才济济,可回溯到当年他们打下的根基。
人工智能发展的“1”,我们到此为止。接着简单地讲讲”2“,也即人工智能可能发展的两条道路。
一条是自主装置,俗称机器人。在工业生产线上的机器人这方面,我国已经很领先。但是,就这视频上波士顿动力的类人机器人来说,问过我国的一个这方面专家,我们却可能差10年到20年。希望这次机器人大赛里头有些年青人有志冲着这个东西去,不要老是都搞一些大家都在重复的玩意。这种类人机器,随着其硬实力和软实力的不断加强,最终会发展到什么程度?答案是我不知道。
另一条路看这张图,是脑机交互增强的所为“超机超人”。这条路我不太以为然。帮助少数残疾生病的还行。借助电极或可穿戴,追求正常人以外的信息交换通道, 然后人非人,机器非机器、这种混搭起来的怪物是我们要的吗?这条路现在马斯克也居然插手了,也来搞这个玩意。好在这条路现在还只是开头而已。
下面继续来讲“3”,谈谈一开始提到的人工智能三个维度的支撑,即识别认知、形象思维和抽象思维的基础研究。这张图左边反映的是1981年的诺贝尔奖,颁发给这两人提出特征检测理论。粗略地讲,识别认知过程基本上类似由底向上搭积木块的过程。在突破点“1”中起重要作用的卷积神经网络,基本上就是体现了这样一个精神,是这个理论的一个范例。不过,用的是有标签样本的教师学习。对于无标签样本,怎么办?这就要双向学习。
深度学习的反向传播算法出来后一年即1987年,早期的双向学习就开始了,叫自编码学习。如ppt上的右上角图示, 网络中间层的两边结构对称,把它们对折,就成了双向。先是输入由底向上进行特征抽取,抽象成一代码,代表一个或一类模式,然后顶向下重建这个输入,重建误差小就支持得到的代码的合理性。我在1991年也提出了Lmser学习,如图中左下角所示。一方面,往上退化一步,得到类似近几年出现的基于跨越连接的U网和D网的变种。而再退化一步就回到自编码。另一方面,往左退化一步,得到类似回馈网的变种,再退化一步又回到自编码。
我们可以将顶向下去重建输入,改成去近似其他不同的模式,实现形象思维。图像到图像的一个例子,就是最近很火的换脸术。不仅如此,还可以进行图像到文本、文本到图像、文本到草图、草图到图像、语言翻译、 过去到未来,实现一个事物和另外一事物的具象性的关联和推理,类似做梦或脑子里过电影一样,还可以显示到屏幕上。这就突破了人们的“眼见为实”,可以造出虚的,现实中没有的图片。形象思维的输出还可以用语言对外交流,或驱动执行控制。
1991年的计算能力,没法对多层的Lmser进行计算实验,只对算单层做了计算,确认了其独立分量抽取的特征检测能力。最近我的学生,对多层的Lmser进行计算,发现不仅相比自编码和U网,性能明显优越,尤其是样本较少、攻击强的情况下。而且1991年分析预想的若干认知功能,如联想、概念形成、心像、注意等,也都能成功得到验证。沿着Lmser的路子发展,引入概率理论,在1995年进一步发展成为所谓贝叶斯阴阳学习理论,发表在1995年的NIPS会议上,也被收入了世纪末麻省理工出版的经典汇集《脑理论和神经网络方法》。带起人工智能这一波的兴起,就是NIPS会议。近些年有一些说法,说中国学者的论文进入IJCAI和IAAA是1997年以后,而进入NIPS顶会则是在跨入本世纪几年后,其实这与历史不符,而是80年代就已经进入IJCAI,1995年前本人就在NIPS上发表了四篇论文。
接着再来谈抽象思维,实现搜索、规划、推理。近年的典型代表就是AlphaGo。它的成功,通常的解释是由于蒙特卡洛树搜索,尤其是其中的前探侦察(有如老邓搞特区先试探路)。但是,只有这点是不够的。其实,这一思路在八十年代中后期,中国学者在研究启发式搜索就提出过。成功原因还来自用深度学习网络来看到棋盘,犹如开了天眼,认清了状态并由此联想出,一是告诉你具体有几种走法、走哪最好的策略(犹如孙子相助),二是评断你这盘棋赢的可能性有多大(犹如老子点头与否)。实际上就是抽象思维加上形象认知,双向协同互补。过去,纯用抽象思维所遇到的问题求解困难,都有望如此获得改进。
最后,来讨论人工智能赋能智慧城市。看这张图,列了那么多涉及民生、政务、产业的智慧城市要素。不少城市都在相互参考,结果考虑的大同小异。再看这张,是上海刚刚评出来的二十几个智慧城市场景,那边叫人工智能创新场景。不过上海城市的情况跟珠海的那些可能很不一样,不要都搞同样的东西。能不能每个城市不要重复建设,每个城市重点优势都不同,地理距离也因为4G/5G已经不再重要,能不能共同的部分可以集中式或分布式的来分工,而不同的部分则协同互补,这是我想跟珠海建议的考虑策略。
人工智能到底能给智慧城市赋什么能?赋能前提首先是大数据要多,还得要允许犯点错不是很要紧,因为学习出来的是统计规律。还有一些其他具体要求,这里就不细讲了。可以赋能的维度基本上就是前面讲的三个。
第一个,就是刷脸、会话和它派生出来的各种各样场景,例如金融风控、施工监控、各种量的预测。从这个维度赋能,相对已经比较成熟了。
第二个,就是我们刚才讲的,换脸派生出来的各种各样的赋能。
第三,城市里可能有好多规划搜索问题,需要将老子孙子老邓综合起来,双向协同互补,类似AlphaGo那样赋能。
再有一个赋能场景就是在手机上玩智能,尤其是物联网大发展后,手机的作用也更重要,智能也相对容易玩,因为比较环境可控。
还有一个场景是涉及大数据分析,数据挖掘、知识图谱实际上涉及的是相关关系,看图表中这个例子,只看相关关系,吃了药比不吃药,好像是有改变、有点用,但是,分成男女再来看,得到的结论却恰好相反。也就是说,相关关系不一定反映事实,故用大数据一定要小心。怎么办?要找因果关系。发现因果关系的研究,经过很多年,已积累了一些方法,可以为大数据赋能。最近,我们自己也发展了发现因果关系的新方法。
最后,我觉得珠海是个年轻人的城市,具体场景可以考虑智能旅游,智能家居,与智能园区。还有就是在海洋边,考虑发展海陆空一体化的智能项目,会有独特的特点。 谢谢大家。
附演讲嘉宾介绍:徐雷是上海交大致远讲席教授、认知机器和计算健康研究中心主任、张江实验室脑与智能科技研究院神经网络计算研究中心主任,香港中文大学荣休教授。哈工大77本科,82年到清华师从常迥院士读博士,87年到北大师从程民德院士和石青云院士做博后,次年破格升副教授。其后四年在芬兰Oja、哈佛Yuille、MIT Jordan等团队做博后;93-96年任香港中文大学高级讲师和教授、02年升讲席教授。16年加入上海交大。从事智能领域研究逾37年,有多个被广为引用的先驱性成果。01年当选IEEE Fellow(从计算智能学会当选之首位中国学者)、02年当选国际模式识别学会 Fellow(最早获选的几个华人之一),03年当选欧洲科学院院士。获93年国家自然科学奖、95年国际神经网络学会领袖奖、06年亚太神经网络学会最高奖(首位获奖华人)。
相关文章: