在今年的GAIR2021大会上,一个论坛人潮涌动。在这里观众和演讲者的思想激烈碰撞,一起探讨着人工智能和机器人的发展方向,这就是——IEEE Fellow 论坛。
本次论坛由IEEE Fellow李世鹏博士担任主席,邀请到了来自国内外高校和研究所的多位IEEE Fellow:来自清华大学的王昭诚教授,香港科技大学的熊辉教授,京东集团的梅涛博士,香港中文大学的邢国良教授。
踏入2021年,国际上风云依旧,生活中疫情未了,不管是AI、科技企业还是传统企业,都面临进一步的挑战,也迎来未知的机会。今年的主题为“加速自主创新,重构数智转型”,设立多个有前瞻性的高峰论坛以探讨创新方向,其中IEEE Fellow论坛也在12月10日如约而至。
IEEE Fellow是IEEE授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就。为帮助科研人员了解最新的科学成果,助力学术界和企业界获取研发的关键信息,往届GAIR大会已邀请了数十位Fellow做分享。
在今年的IEEE Fellow 论坛中,每位嘉宾的发言依然精彩:
王昭诚教授结合了多年的科研及工业落地经验,为我们展现了人工智能技术在未来6G移动通信中的重要作用。
毫米波通信热度很高,但有很多因素阻碍了其广泛应用,其中功耗、鲁棒性、成本等原因最为明显。如何使用人工智能技术降低功耗、提高鲁棒性、解决成本问题,就是毫米波技术突围的核心所在。
从感知智能过度到认知智能是一种宏观统筹的期望,希望算法达到从视觉迁移到知觉、触觉、听觉等方面的能力。在未来,这是AI发展的大方向。
注意力机制Attention、聚类Clustering、规则化Regularization等等都是简易工具。它们都是简易的过程,其目的就是让我们聚焦到事物的本质——不易。
以智慧灯柱为代表的路边基础设施辅助的自动驾驶挑战在于有效使用灯柱的传感器辅助车辆的感知。这需要精准的点云配准技术来利用路边的激光雷达扩展车辆的视野。这就像连接了灯柱上的传感器一样,开了“天眼”。
人工智能在很大程度上是在模仿人类的认知过程。认知科学的很多观察和结论,目前还没有充分被人工智能所借鉴。比如说人有些智能是生而知之;人的学习认知过程在早期就会收敛到一个“思路”模型;人是从多源多模态的输入中学习和进化认知的;人的归纳总结能力往往通过人类示教获得和完善的等等。因此在未来的机器学习过程中,其可能的发展方向可能是多源和多模态的输入,加上考虑示教和归纳能力的学习模型。
以下是每位嘉宾的演讲要点精编:
王昭诚:AI赋能毫米波波束管理
首先由王昭诚教授带来题为《AI赋能毫米波波束管理》的演讲。
王昭诚教授是清华大学长聘教授,IEEE Fellow/IET Fellow,2020年科睿唯安全球高被引科学家,而波束管理正是王教授的个人学术标签。王教授的研究方向包括面向6G的毫米波/太赫兹无线通信、面向智能交通的可见光通信和AI赋能的智能通信。
在演讲中,王教授结合了多年的科研及工业落地经验,为我们展现了人工智能技术在未来6G移动通信中的重要作用。6G移动通信作为未来爆发的焦点话题之一,成为学术和工业界的兵家必争之地,而AI赋能的智能通信成为其核心关键技术。
王教授介绍了毫米波在未来6G移动通信中的重要意义,并着重介绍了融合低频/毫米波终端的技术挑战和未来发展趋势。
毫米波通信热度很高,但有很多因素阻碍了其广泛应用,其中功耗、鲁棒性、成本等原因最为明显。如何使用人工智能技术降低功耗、提高鲁棒性、解决成本问题,就是毫米波技术突围的核心所在。
王教授介绍了基于深度学习的低频辅助毫米波波束预测。在使用毫米波进行通讯时,存在着多方面的问题,比如损耗大、成本高、功耗大、鲁棒性差等问题。
在王教授的工作中,核心思想为利用毫米波和低频的直射径/反射径达到角的一致性解决上述困难。
首先,在入网的阶段,王教授提出可以利用低频和高频信道的一致性降低终端功耗:当终端设备需要利用毫米波链路进行高速信息传输时,其功耗较大。因此可以使用低频估计直射径是否存在,如果有直射径的条件下才开启毫米波服务。
其次,在开启毫米波服务后,使用低频预测毫米波波束的到达方向。由于任务的复杂性和多模态特征,需要使用AI寻找最佳的到达角。王教授通过使用专门设计卷积神经网络、实部/虚部预处理、以及降采样等组合技术解决上述问题并得到极佳的实验效果。
随后,王教授介绍了基于深度学习的低频辅助毫米波波束跟踪。利用低频信道估计信息,实现毫米波终端的动态跟踪。特别地,利用LSTM网络来进行平滑跟踪,LSTM可以估计出通信中隐藏的重要中间变量,实现快速跟踪。
最后,王教授介绍了基于深度学习的毫米波快速波束训练,可以使用功率泄露的宽波速来进行最优波束的估计和扫描。
未来毫米波和人工智能的应用广泛,比如无线环境感知和工业物联网,王教授总结了当前的应用进展,并提出了多项技术挑战。
梅涛:感知智能到认知智能的关键蜕变
梅涛博士(线上演讲)
第二位演讲者是梅涛博士,他的演讲题目是《从感知智能到认知智能的视觉计算》。
梅涛是IEEE/IAPR Fellow,京东集团副总裁,京东探索研究院副院长。 在演讲中,梅博士结合了自己在大型科技公司多年的工作经验,从生活和应用的角度为我们生动地总结了AI的各种成功应用,也以此由浅入深地介绍了从感知智能到认知智能的必要性。认知智能面临着多方面的挑战,而这正是学术和工业界未来的发展方向。相信终有一天,AI能够脱离领域的束缚,达到像人类一样多模泛化的程度。
当前的计算机视觉领域发展飞快,多项技术已经可以达到媲美人类甚至超越一般人类的能力。例如图像分类识别、目标定位。同时AI在内容合成(图像生成、图片描述生成)上进步飞速。但是这毕竟知识感知智能(学标),并非具有“认知能力”的真正人工智能(学本)。
在梅涛博士的演讲中,他分别介绍了视觉认知技术上的最新技术及应用情况、算法从感知智能到认知智能的必要,以及视觉领域的未来发展方向。
在过去的50年中,计算机视觉领域经历了巨大的变革。从最初的特征工程到目前的深度学习,其性能和精度都在同步的提升。最新的计算机视觉技术可以分为标签识别、目标跟踪、视频流行为识别、语义分割、文字生成图像、3D视觉感知等领域。
在细粒度的视觉识别研究中,基于各种模型结构技术(例如自注意力机制)已经可以实现精细物体、标签的识别。而在3D图像处理领域,很多技术能够辅助将日趋成熟的2D技术迁移至3D领域。在图像的文字描述方法中,很多商品图片的描述、根据文字自动生成模拟换装效果的技术也已经大规模使用。
随后,梅博士结合实际的产品为我们介绍了视觉AI的各种有趣应用,包括基于图片的商品搜索、搭配推荐、智能导播、智能客服等。这些技术已经深入到我们生活的方方面面。
梅博士介绍道,从感知智能过度到认知智能是一种宏观统筹的期望,希望算法达到从视觉迁移到知觉、触觉、听觉等方面的能力。在未来,这是AI发展的大方向。
在这个过程中,鲁棒性、数据偏见等方面的挑战十分严峻。从目标的角度上来说,传统人工智能能够增强人们的认知并且提供辅助。而感知智能则是希望能够理解人类的行为,并且拟人进行推理等功能。在能力方面,以前的人工智能方法希望能够找到模式,而感知智能是想将人类的意识和理解进行建模,并且找到解决事情的思路和逻辑。
在这个前进的过程中,需要解决三个核心问题:对结构知识进行建模,模型的可解释性,以及推理能力的集成。
最后,梅博士介绍了视觉领域的未来发展方向。他认为计算机视觉目前已经行进到技术谷的第四阶段尾声,意味着它可以在未来的两三年间被工业界大量应用,从而影响我们的生活。
熊辉:AI思想在人性和社会性中的体现
熊辉教授
第三位演讲者是熊辉教授,他的演讲题目是《人工智能算法中的人性和社会性》。
熊辉教授现为香港科学技术大学(广州)讲席教授,人工智能学域主任;曾在学术休假期间担任百度研究院副院长并主管5个实验室。
熊辉教授一直致力于数据挖掘、大数据分析等领域的科学研究。在熊教授的演讲中,他深入浅出的将人工智能经典算法进行更高层级的审视和回顾。他用清晰的思路和生动的比喻为我们介绍了人工智能和人类社会的关系。如果想真正做好算法,一定要知道领域知识和专业知识的结合,明白什么是不易。领域知识能够告诉我们不易在哪、是什么。然后做到艺术和哲学的有机平衡,才能做好算法的应用。
熊教授首先介绍了GAN算法与人性以至于社会性的关联。在GAN的世界中,有目标驱动的辨别式学习方法,就像为了考试而背题。还有以学习问题根源为目标的生成式学习方法,即学习问题背后的本质。
而站在个人的层面,我们也需要一个很好的辨别器。不同的人有不同的经历和选择。他们有的成功,有的失败,主要的区分在于自己所使用或经历的辨别器。好的匡正你的未来,来让你的人生走在正确的方向上,让你的资源用在正确的方向上。人生就是一场漫长的算法,二者一一对应。算法之所以有用,很大的原因就是它从生活中来,抽象了我们的经验和哲理。
站在一个系统的宏观角度来观察所有的人工智能算法,可以将其用易经的理论进行梳理。它们可以分成三个主要类别,不易、简易和变易。
事物的本质就是不易,是万事万物中那些恒定不变的东西。我们最重要的失去学习事物中那些不易的知识树。那么如何去把握住这些根本性的不变的东西,就是我们学习的难点。
熊教授介绍道,CNN其实就是一个通过简易寻找不易的过程。而集成学习Ensemble learning就是民主投票,少数服从多数,让多数人认可的结果作为最终输出,这也是一种寻找不易的过程。
而后,熊教授介绍了简易的过程。注意力机制Attention、聚类Clustering、规则化Regularization等等都是简易工具。它们都是简易的过程,其目的就是让我们聚焦到事物的本质——不易。
大数据带来的最好的本质提升是让其“不易”的本质更容易被识别和捕获,也就是带来概率本质上的一些信息的凸显。其中,分层级的聚类方法类似于资本主义,而k-means方法类似于社会主义。当我们在实际中将两者结合起来,便是我们的“中国特色社会主义”。它既能坚固市场经济的灵活性,又能融合社会主义的大局领导力。这便是聚类算法的社会性表现。
最后熊教授介绍“变易”。这里面的代表性算法是强化学习。
强化学习算法的Agent能够感知环境的状态,之后可以采取一些动作,比如动作就是砍树。当树砍光,环境变差,就要通过Reward来惩罚我们的Agent。如此一来,人类就知道这样做不好。因此,人类不光不要砍树,还要去植树。如此,就能形成一个良性闭环。人类不断感知环境并采取行动,这就是强化学习算法的人性化特点。
在总结阶段,熊教授说,只有当我们了解了算法人性和社会性,我们才能发挥算法的艺术性。而且做算法一定要有“中庸之道”。我们知道机器学习要在bias和variance之间取得平衡。前者导致过拟合,后者导致欠拟合,任何一种都是我们不能接受,也无法使用的。
邢国良:物联网与AI的新时代碰撞
邢国良教授(线上演讲)
第三位分享者是邢国良教授,他的演讲题目是《支持车路协同自动驾驶的实时边缘系统》。
邢国良现任香港中文大学信息工程系教授,IEEE Fellow,2006年获美国圣路易斯华盛顿大学博士学位,并曾在美国密歇根州立大学任助理教授、终身副教授。他领导了多项人工智能项目,在智慧城市城市、智能驾驶等领域有着深入的研究。
在演讲中,邢教授介绍了支持车路协同自动驾驶的实时边缘系统。物联网、自动驾驶和智慧城市作为AI落地的沃土,其蕴含的潜力十分庞大。从邢老师的精彩分享中,我们看到了物联网+AI+视觉+自动驾驶的新型融合模式,并且为未来的智慧城市、自动驾驶辅助驾驶等领域开拓了新的方向和可能。
自动驾驶在近些年大热,也成为了未来市场的爆发点。在世界的各大城市中,为了支持自动驾驶也逐渐开始了城市智能化的升级,包括利用电线杆和灯柱等设施辅助自动驾驶。如此的设计可以提高自动驾驶的安全性,并且降低自动驾驶的成本,这是一个很有意义的方向。
邢教授介绍道,智能城市中的智慧灯柱,可以在不侵犯用户隐私的前提下,使用激光雷达等下一代智能传感器实现行人车辆的识别。这样的设备也可以用在辅助驾驶和自动驾驶场景中。然而其计算资源通常十分有限。
为了解决这些问题,邢教授提出了基于模型压缩和优先级调度的实时AI系统。这种方法针对不同的深度网络进行多级压缩,而后通过联合优化压缩级别和优先级来优化执行策略。在经过模型多变体压缩融合、优先级联调等技术后,实际效果十分良好。
邢教授介绍道,以智慧灯柱为代表的路边基础设施辅助的自动驾驶挑战在于有效使用灯柱的传感器辅助车辆的感知。这需要精准的点云配准技术来利用路边的激光雷达扩展车辆的视野。这就像连接了灯柱上的传感器一样,开了“天眼”。
为了实现这样的目的,邢教授团队设计了一个可以找到点云语义信息(如路边的交通标志)的轻量化方法等。其优点在于精简了配准所需的数据量,仅需进行语义级别的配准,而不需要传输原始激光雷达图像,从而降低车辆的算力要求。以上技术已经在邢教授团队部署的大型智慧灯柱平台上进行了验证。
李世鹏:机器人中的人工智能何去何从?
李世鹏博士现场照片
最后进行演讲的是李世鹏博士,他的演讲题目是《人工智能与机器人前沿研究思考》。
李世鹏博士,IEEE Fellow,国际欧亚科学院院士 。李院士历任深圳市人工智能与机器人研究院首席科学家和执行院长、科大讯飞集团副总裁及讯飞研究院联席院长、微软亚洲研究院创始成员与副院长。
在演讲中,李博士介绍了人工智能和机器人前沿研究的深入思考。机器人作为人类未来社会中不可缺少的重要组成部分,其发展与我们的生活、隐私和便利息息相关。李老师为我们详细介绍了人工智能和机器人领域上的发展方向,分别从机器学习能力提升、运动智能的发展、人机谐作的未来以及人群体协作四个方面进行了综述和展望,具有很强的导向意义。
首先李博士带我们了解了人工智能和机器人研究的全景图。而后对其中的关键技术,即机器学习、运动智能、人机谐作、群体协作进行了介绍。
在这个全景图里,核心的三元素是人、人工智能和与物理世界接口的机器人/物联网;他们两两之间的交互和作用,形成了一个个人工智能与机器人领域的不同学科和方向;而这些智能体变得众多时,群体之间的协作就变的很重要。在AI+机器人领域中,最重要和核心的一个主题便是研究人、机器和环境之间的交互和协作的哲学和方法。李博士介绍说,该领域的研究方向可以分成机器学习、运动智能、人机谐作和群体协作等基本方向。
在机器学习方面,由于深度学习等算法对标记数据的严重依赖性,模仿人类认知的建模研究成为未来的突破口,因此,认知科学启发的机器学习或成为人工智能未来的发展方向。
李博士介绍到,人工智能在很大程度上是在模仿人类的认知过程。认知科学的很多观察和结论,目前还没有充分被人工智能所借鉴。比如说人有些智能是生而知之;人的学习认知过程在早期就会收敛到一个“思路”模型;人是从多源多模态的输入中学习和进化认知的;人的归纳总结能力往往通过人类示教获得和完善的等等。因此在未来的机器学习过程中,其可能的发展方向可能是多源和多模态的输入,加上考虑示教和归纳能力的学习模型。
而在机器人的运动智能方面,李博士介绍说,虽然目前的最先进机器人已经可以执行灵活丝滑的运动控制,但是其计算资源消耗严重,因为它基于电机的控制。但是人类是基于肌肉-骨骼-传感-神经的系统中进行低能耗的运动,此时自适应、低耗能、鲁棒性、灵活性都得到了体现。
人机谐作也是未来的重要方向。我们目前总是希望AI能够完成所有任务,完全解放人类。但是就算算法再强大,仍然有一些边界情况无法完成。那么人机协作——“AI不行,UI来补”则是很好的解决方案。即机器只需要知道什么情况是它无法解决的,此时交给人类即可。
更远一点,随着各种智能机器走进人们的生活,人和机器如何和谐相处,更高效地协同完成任务,又是一个重要的研究课题。在人机增强机体方面,李博士认为,我们可以希望机器人能够自动感知到人们的需求,恰到好处地执行辅助功能。
最后在群体协作方面,李博士认为算法可以借鉴人类、动物群体的群体智能经验,脱离单独智能体的局限性,做到1+1>>2的卓越效果。
总结
聆听五位IEEE Fellow的前沿布道,让我们对当前人工智能、物联网、视觉和机器人领域有了更加深入的理解和认识。在这里,人工智能不再变得冰冷,它被赋予了社会性、人性,它的发展聚焦到了生活的每个角落,包括每辆车、每个灯柱、每座楼宇和每台手机电脑。相信在不远的未来,AI和机器人的有机结合将会为我们的生活带来巨大的惊喜!
让我们期待下一届的IEEE Fellow 论坛。
2021-12-10
2021-12-09
2021-12-12
雷峰网雷峰网(公众号:雷峰网)