欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

作者：张帅

2019/09/15 15:34

雷锋网消息，9月7日，在全球学术界、产业界的领袖精英的见证之下，工信部第二届“绽放杯”5G应用征集大赛之珠海智慧城市专题赛暨2019岭南大数据国际论坛在珠海横琴国际会展中心隆重开幕。作为国际大数据、5G、智慧城市领域顶级活动，此次论坛规模相比去年再度升级，与会人数创新高，全球创新创业企业汇聚于此，诸多享誉国内外的院士专家作为嘉宾重磅亮相。

本次活动由珠海市工业和信息化局、珠海市科技创新局、珠海（国家）高新区管委会、珠海市人才工作领导小组、中国移动广东公司珠海分公司、广东广电网络珠海分公司、珠海华发集团、珠海城建集团、珠海市岭南大数据研究院等主办，广东城智科技有限公司、珠海市岭南大数据研究院联合协办，得到了工信部、珠海市人民政府、中国移动研究院、中国移动广东公司等大力支持。该活动吸引了来自全球5G、大数据、人工智能、物联网等领域顶级院士、专家和企业代表参会，旨在打造国内5G智慧城市领域高端学术交流峰会。雷锋网作为协办单位，深度参与本次活动。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷发表了《人工智能科技对智慧城市未来的影响》的演讲。徐雷教授主要分享了自己对人工智能的看法，并简单探讨了智慧城市的话题。

他认为，人工智能从某种意义上来说可以从识别认知、形象思维和抽象思维三个维度来了解，而当今人工智能第三次浪潮的核心突破点是在识别认知方面。他提到，根据《自然》近期的一篇评论，在基础理论和算法创新层面，中国同英美尚且有五到十年差距。关于智慧城市，徐雷教授认为，我国智慧城市的发展应该结合不同城市的情况，毕竟每个城市的痛点和优势不同，而在 4G/5G 网络的支撑下，地理距离已经不再重要，每个城市也没有必要进行重复建设；从这个角度出发，我国应当大力发展智慧城市集群。

以下是雷锋网根据徐雷院士在大会上的30分钟讲演编辑整理出的分享内容：

我的演讲题目内容分为两个部分：人工智能发展和智慧城市。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

人工智能有没有定义？我们来看大脑，若从内在机制的角度看，看它整个结构，很复杂，基本上面对的是失败，这一次欧洲脑计划也基本上是失败了。从外在表现的角度看，目前主要有两个方向。一个刚才陈老师从认知科学研究与应用的角度。再一个就是从经典的计算机信息处理，可以泛泛地认为智能就是大脑的信息处理活动。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

不过，现在最简单而常用的是图灵测试，就是说，若分不出是人和还是机器干的，机器就是有了智能，那么大概要多少？30%还是50%，有不同做法。但这样可能太泛了，所以我还想把各种各样的人工智能，稍微归纳一下，为此把1975年钱学森先生关于思维科学的一些思路拿过来，并整理修改推广一下。

人工智能有三个主要的部分。第一个俗称为“刷脸识别”，这个后头会讲，是这一波人工智能发展的主要突破点。

第二个，早在1975年，钱学森先生就认为，常用而重要的智能部分其实是在形象思维。而那时候，人工智能界主要都在研究抽象思维。粗略地讲，形象思维就是比较具象、根据关联性就具体模式或其映象进行的推断。而抽象思维则是根据逻辑、因果条理进行的推理，大概是这个状况。

很有意思，这两种不同方式，中国人和西方人正好分别擅长其一。中国文字基本是象形的，思维发展偏重形象思维，而西方文字抽象成符号，抽象到26个字母加标点符号，拼写组合成符号串，并包括A+B=C等数学抽象，注重相互关系、注重形式语法。实际上，图灵机以及后来的计算机就是基于对西方自然语言的简化，发展变成了当今的计算机能力，可以说几乎达到从这个角度模拟智力发展的顶峰，只不过通常已经不把它算进人工智能了。

而我们的古文是没有语法，没有标点。就是现在，至少要认3000个字，差不多才算懂中文。我们就没有发展到符号抽象的这一步。很有意思的是，西方其实按照历史（如果我是对的话，这方面不在行），大概5000年前古埃及的形象文字走向古希腊符号文字。是什么促使它走向了这种抽象，而我们的文字却没有，值得从智能发展的角度去探讨。正是因为它高度的抽象，西方学者把抽象思维叫高级智能，高度抽象以后才有科学在那里生长发展。中国文字没有这种抽象，可能很大程度致使中国没有发展出科学。

解析确定若干独立的基本单元（如语文中字母符号集或数学体系中的公理），先是考虑它们两两之间的二元关系（如逻辑、因果、以及某种依赖关系），再像搭积块似的，按一定的规则或规律，循理择优，由底朝上逐步组合，搭出一个体系或世界来。它有利于抓住主要脉络，解释所看到的现实世界。但是，有限的基元数，有限的组合规则，只能描述相对简单的人工世界。如何从自然世界获得这些基元和规则，且自然事物的复杂性导致组合可能性的庞大，导致用抽象思维的方式针对“刷脸识别”这类智能，反而遇到很大困难。

而中国的学问是从整体开始，混沌分阴阳，阴阳和谐说其实就是一分为二的系统构成论，然后五行说就是定性描述这个系统的动力学，这两个学说，其实像西方科学一样，是经得起恒常律和普适律检验的，这里就不细说了。若往下再分，八卦就比较玄了。不管如何，这种从顶往下、具体具象的思维方式，正好与抽象思维的方式互补，反映了智能的两面，也反映了文化的两面，应该中西融合和谐发展，不应对立互打。

这次人工智能浪潮就是在形象思维的部分突破的，“耳聪目明“ 就是形象思维的基础。做法其实很简单，就是数学上完成一个X到Y的一个整体性的映射，用一个深度神经网络结构来实现。在目明的角度上大概超过了人，耳聪的角度上接近人。

大概是我们的文化偏好形象思维，也很巧了，不仅这次的推波助澜的引起主要发展都是华人，过去一路走来致力于推动“耳聪目明“，华人也是主角之一部分。

大家可能知道，Hinton团队在2006年发现深度学习网络可以显著改善识别性能后，就是微软的邓力，也是我的一个朋友，把Hinton请到微软，将语音识别显著推进。接着李飞飞搞image-net，建立超大规模的头像数据库，使刷脸识别大大推进，导致工业界和资本的广泛介入“耳聪目明“行业。你再看这张图，我国目前的公司分布情况，基本上也主要在这一块。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

这是人工智能的盘山式发展图，它是立体向上的。我们的机遇不是弯道超车，而是有机会实现跨越。还有，大家都觉得人工智能这次是第三次浪潮，其实不尽然。抽象思维发展到了冯诺依曼机以后，其实已经是机器模拟智能的巨大成功了，不过刻意不算它了。

再走到自然语言和视觉，受阻了，推不动了。但人工智能还在发展，热潮移到了另外一批人，走形象思维，攻“耳聪目明”。类似地，然后又转移到了再下一批人。尽管早在57年就有华人介入字符识别，主要是70年代中期到80年代中期，主攻“耳聪目明“的模式识别，开始了它第一个十年的发展期，头号领袖是左图的傅京孙先生（1930-85）。图上的另外五位百岁级已故院士，都是中国人工智能发展的先驱。左边另外两位是常迥先生和程民德先生，领导了中国模式识别的发展，建立了我国智能科学的第一批三个国家重点实验室，其中两个主攻模式识别与机器认知，并在我国学科设置上正式开出了模式识别的相关专业，近年来我国 “耳聪目明“方面的人才济济，可回溯到当年他们打下的根基。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

人工智能发展的“1”，我们到此为止。接着简单地讲讲”2“，也即人工智能可能发展的两条道路。

一条是自主装置，俗称机器人。在工业生产线上的机器人这方面，我国已经很领先。但是，就这视频上波士顿动力的类人机器人来说，问过我国的一个这方面专家，我们却可能差10年到20年。希望这次机器人大赛里头有些年青人有志冲着这个东西去，不要老是都搞一些大家都在重复的玩意。这种类人机器，随着其硬实力和软实力的不断加强，最终会发展到什么程度？答案是我不知道。

另一条路看这张图，是脑机交互增强的所为“超机超人”。这条路我不太以为然。帮助少数残疾生病的还行。借助电极或可穿戴，追求正常人以外的信息交换通道，然后人非人，机器非机器、这种混搭起来的怪物是我们要的吗？这条路现在马斯克也居然插手了，也来搞这个玩意。好在这条路现在还只是开头而已。

下面继续来讲“3”，谈谈一开始提到的人工智能三个维度的支撑，即识别认知、形象思维和抽象思维的基础研究。这张图左边反映的是1981年的诺贝尔奖，颁发给这两人提出特征检测理论。粗略地讲，识别认知过程基本上类似由底向上搭积木块的过程。在突破点“1”中起重要作用的卷积神经网络，基本上就是体现了这样一个精神，是这个理论的一个范例。不过，用的是有标签样本的教师学习。对于无标签样本，怎么办？这就要双向学习。

欧洲科学院院士、上海交大AI研究院首席科学家徐雷：智慧城市应避免重复建设

深度学习的反向传播算法出来后一年即1987年，早期的双向学习就开始了，叫自编码学习。如ppt上的右上角图示, 网络中间层的两边结构对称，把它们对折，就成了双向。先是输入由底向上进行特征抽取，抽象成一代码，代表一个或一类模式，然后顶向下重建这个输入，重建误差小就支持得到的代码的合理性。我在1991年也提出了Lmser学习，如图中左下角所示。一方面，往上退化一步，得到类似近几年出现的基于跨越连接的U网和D网的变种。而再退化一步就回到自编码。另一方面，往左退化一步，得到类似回馈网的变种，再退化一步又回到自编码。

我们可以将顶向下去重建输入，改成去近似其他不同的模式，实现形象思维。图像到图像的一个例子，就是最近很火的换脸术。不仅如此，还可以进行图像到文本、文本到图像、文本到草图、草图到图像、语言翻译、过去到未来，实现一个事物和另外一事物的具象性的关联和推理，类似做梦或脑子里过电影一样，还可以显示到屏幕上。这就突破了人们的“眼见为实”，可以造出虚的，现实中没有的图片。形象思维的输出还可以用语言对外交流，或驱动执行控制。

1991年的计算能力，没法对多层的Lmser进行计算实验，只对算单层做了计算，确认了其独立分量抽取的特征检测能力。最近我的学生，对多层的Lmser进行计算，发现不仅相比自编码和U网，性能明显优越，尤其是样本较少、攻击强的情况下。而且1991年分析预想的若干认知功能，如联想、概念形成、心像、注意等，也都能成功得到验证。沿着Lmser的路子发展，引入概率理论，在1995年进一步发展成为所谓贝叶斯阴阳学习理论，发表在1995年的NIPS会议上，也被收入了世纪末麻省理工出版的经典汇集《脑理论和神经网络方法》。带起人工智能这一波的兴起，就是NIPS会议。近些年有一些说法，说中国学者的论文进入IJCAI和IAAA是1997年以后，而进入NIPS顶会则是在跨入本世纪几年后，其实这与历史不符，而是80年代就已经进入IJCAI，1995年前本人就在NIPS上发表了四篇论文。

接着再来谈抽象思维，实现搜索、规划、推理。近年的典型代表就是AlphaGo。它的成功，通常的解释是由于蒙特卡洛树搜索，尤其是其中的前探侦察（有如老邓搞特区先试探路）。但是，只有这点是不够的。其实，这一思路在八十年代中后期，中国学者在研究启发式搜索就提出过。成功原因还来自用深度学习网络来看到棋盘，犹如开了天眼，认清了状态并由此联想出，一是告诉你具体有几种走法、走哪最好的策略（犹如孙子相助），二是评断你这盘棋赢的可能性有多大（犹如老子点头与否）。实际上就是抽象思维加上形象认知，双向协同互补。过去，纯用抽象思维所遇到的问题求解困难，都有望如此获得改进。

最后，来讨论人工智能赋能智慧城市。看这张图，列了那么多涉及民生、政务、产业的智慧城市要素。不少城市都在相互参考，结果考虑的大同小异。再看这张，是上海刚刚评出来的二十几个智慧城市场景，那边叫人工智能创新场景。不过上海城市的情况跟珠海的那些可能很不一样，不要都搞同样的东西。能不能每个城市不要重复建设，每个城市重点优势都不同，地理距离也因为4G/5G已经不再重要，能不能共同的部分可以集中式或分布式的来分工，而不同的部分则协同互补，这是我想跟珠海建议的考虑策略。

人工智能到底能给智慧城市赋什么能？赋能前提首先是大数据要多，还得要允许犯点错不是很要紧，因为学习出来的是统计规律。还有一些其他具体要求，这里就不细讲了。可以赋能的维度基本上就是前面讲的三个。

第一个，就是刷脸、会话和它派生出来的各种各样场景，例如金融风控、施工监控、各种量的预测。从这个维度赋能，相对已经比较成熟了。

第二个，就是我们刚才讲的，换脸派生出来的各种各样的赋能。

第三，城市里可能有好多规划搜索问题，需要将老子孙子老邓综合起来，双向协同互补，类似AlphaGo那样赋能。

再有一个赋能场景就是在手机上玩智能，尤其是物联网大发展后，手机的作用也更重要，智能也相对容易玩，因为比较环境可控。

还有一个场景是涉及大数据分析，数据挖掘、知识图谱实际上涉及的是相关关系，看图表中这个例子，只看相关关系，吃了药比不吃药，好像是有改变、有点用，但是，分成男女再来看，得到的结论却恰好相反。也就是说，相关关系不一定反映事实，故用大数据一定要小心。怎么办？要找因果关系。发现因果关系的研究，经过很多年，已积累了一些方法，可以为大数据赋能。最近，我们自己也发展了发现因果关系的新方法。

最后，我觉得珠海是个年轻人的城市，具体场景可以考虑智能旅游，智能家居，与智能园区。还有就是在海洋边，考虑发展海陆空一体化的智能项目，会有独特的特点。谢谢大家。

附演讲嘉宾介绍：徐雷是上海交大致远讲席教授、认知机器和计算健康研究中心主任、张江实验室脑与智能科技研究院神经网络计算研究中心主任，香港中文大学荣休教授。哈工大77本科，82年到清华师从常迥院士读博士，87年到北大师从程民德院士和石青云院士做博后，次年破格升副教授。其后四年在芬兰Oja、哈佛Yuille、MIT Jordan等团队做博后；93-96年任香港中文大学高级讲师和教授、02年升讲席教授。16年加入上海交大。从事智能领域研究逾37年，有多个被广为引用的先驱性成果。01年当选IEEE Fellow（从计算智能学会当选之首位中国学者）、02年当选国际模式识别学会 Fellow（最早获选的几个华人之一），03年当选欧洲科学院院士。获93年国家自然科学奖、95年国际神经网络学会领袖奖、06年亚太神经网络学会最高奖（首位获奖华人）。

智汇珠海！2019岭南大数据国际论坛在珠海圆满落幕院士专家共谋5G智慧城市变革

为什么智慧城市在 2019 年火起来了？

5G应用大赛、智慧城市院士论坛，这一届“珠海绽放杯”的6大看点！

专题

2019岭南大数据国际论坛·特写查看更多文章