雷锋网 AI 科技评论按:美国加州长滩最近很热闹,继机器学习国际会议 ICML 2019之后,计算机视觉与模式识别会议 CVPR 2019 也紧接着于6 月 16 日至 20 日在这里举行。许多学者都是连续参加两个会议,不少学者甚至两个会议中都有论文,演讲途中偶尔就会冒出来(比如在 CVPR 的演讲中):「由于时间原因某某工作我就不细说了,感兴趣的可以参见我们的 ICML 论文」,并附上标题和地址。
作为计算机视觉理论、技术、相关应用的学术交流盛会,近年来参加 CVPR 的人数也和其他计算机科学相关会议一样不断增加。虽然具体人数要到第三天 18 日的会议开幕式上才会揭晓,但在 15 日任何会议议程都尚未开始的时候 CVPR 组委会就专门发了邮件提醒参会者们提前半天到场签到、取参会证,以免因为排队而错过会议议程;以及由于满员,原定的可以在现场缴费注册参会也在最后时刻取消了。在现场的感受印证了组委会的担忧,即便 15 日下午已经有不少人去了会场签到、16 日 17 日全天都可以签到,16 日早晨在签到席前依然排起了长队,甚至一直排到了场馆外面。
发邮件提醒提前签到其实只能算是最后时刻的小手段,实际上最重要的是订足够大的会议场馆。为了能容纳这么多参会者、有足够空间安排会议议程,组委会订下的会议场馆实际上由三栋建筑组成:长滩会议中心(Long Beach Convention & Entertainment Center)有两个大会议厅、数个小会议厅,还有巨大的展区供企业布展;长滩表演艺术中心(Long Beach Performing Arts Center)有一个大表演厅和多个小会议厅;长滩竞技场(Long Beach Arena, Pacific Ballroom)更是一个可以容纳数千人的体育馆。这还不够,紧邻的 Hyatt 酒店还被征用了数个会议厅供前两天的议程使用。
早餐午餐的用餐地点都在户外,组委会在建筑外围多个区域分别安排了成片的桌椅。按照这个阵势,有人猜测这届 CVPR 有远超此前的多达六千人参加,雷锋网 AI 科技评论记者自己的猜测是四千人,等待开幕式揭晓答案吧。
此外,我还有一个很明显的感受,就是来自中国的教授和学生(硕士、博士研究生)非常多,黑头发黄皮肤的参会者差不多有 1/4 到 1/3,而且擦肩而过时基本都可以听到他们讲的是中文。
按照惯例,CVPR 第一、第二天的内容是教学讲座(tutorial)和主题研讨会(workshop)。教学讲座主要面向的是学生以及开展科研工作不久的青年学者们,演讲内容以梳理、解读现有技术成果为主。主题研讨会则是供已经在某个课题上作出成果的学者们发表、介绍自己的论文,并和在场的同一个方向的其他学者们展开交流。
第一天最火爆的教学讲座当属 Facebook 人工智能研究院 FAIR Ross Girshick & 何恺明组组织的「Visual Recognition and Beyond」(视觉识别以及更多),Ross 也第一个登台演讲。一上午的教学讲座由多位FAIR的研究员轮流介绍了图像及视频的实例级别对象识别所在的大方向在近几年中的技术成果,涵盖了图像分类、视频分类、对象检测、动作检测、实例分割、语意分割、全景分割、姿态估计等多种任务的方法和原理。参加这个教学讲座的人一直满满当当地挤到了会议厅门口。感兴趣的读者可以在教学讲座主页 http://feichtenhofer.github.io/cvpr2019-recognition-tutorial/ 下载演讲PPT。
Ross Girshick 在台上演讲,整个屋子满满当当
另一个火爆程度类似的教学讲座是「Deep Learning for Content Creation」(深度学习内容创建),全天的教学讲座同样座无虚席。这个教学讲座首先向其它方向的研究人员们介绍了这个领域研究的基本概念,然后介绍了目前已经取得成果的深度学习内容创建方法,最后讨论了领域的最新动向和亟待解决的问题。
前两天其它的教学讲座还包括:胶囊网络在 CV 中的应用、基于地点的计算机视觉推理、数据驱动计算图像学、百度阿波罗开放平台介绍、计算机视觉中的元学习等等许多。许多课题都又基础又热门,让人难以抉择要参加哪个。
主题研讨会(workshop)的内容就更多样、更具体、更前沿一些了,多模态学习和应用、可解释 AI、医疗机器视觉、视觉问答、三维场景重建、语言与视觉、降噪去雾超分辨率、骨架搜索、再识别等好几十个具体课题都有各自的主题研讨会,对应领域的学者在其中轮流介绍自己的相关成果;也有一些研讨会的内容是挑战赛,比如 AI City 挑战赛、CARLA 自动驾驶挑战赛、运动识别挑战赛等。由于数量实在太多,雷锋网 AI 科技评论记者也只能选择性地参加了其中几个(走马观花)。
Adversarial Machine Learning in Real-World Computer Vision Systems Workshop(真实世界的计算机视觉系统中的对抗性学习) 现场,介绍白盒攻击的特点
Egocentric Perception, Interaction and Computing Workshop(自我为中心的感知、交互和计算)现场,讲解杯子与世界的交互不一定是装水,也可以有别的作用,借此引出定义物体的交互矢量
Computer Vision for Global Challenges Workshop (计算机视觉解决全球的挑战)现场,研究者利用计算机视觉技术和高分辨率卫星图像准确地分辨哥伦比亚各处散布的学校
除了各个研讨会内部的交流,CVPR 组委会还设置了全体主题研讨会接收论文的海报展示环节,在长滩竞技场内、在零食和饮料的映衬中,全球的学者们自由地浏览各个主题的论文并展开讨论。
有一个尤为有趣,也广泛吸引了许多不同方向的学者们参与的主题研讨会名为「Computer Vision After 5 Years」,顾名思义,让学者们远眺未来,预测五年后的计算机视觉相比现在会有多大异同。这个研讨会请到的嘉宾包括前文提到的 Ross Girshick、CV 祖师爷 Jitendra Malik、CV 知名学者 Alexei Efros 等多位重磅人物,他们的演讲既风趣幽默也引发了许多对于计算机视觉研究的本质的思考。关于这个研讨会雷锋网 AI 科技评论将会单独带来一篇详尽的实录文章,敬请期待。
除了帮助呈现学术成果,顶级学术会议其实有一个非常重要的功能就是把全世界的学者们都聚集起来,给他们一个轻松自由的交流氛围。在演讲间隙聊、在茶歇时候聊、在吃饭时聊、在一天的议程结束、场馆闭馆以后还可以继续聊。
会议第三天,也就是美国加州时间 18 日开始将进入大会正会,内容主要为 CVPR 组委会的全体演讲(开幕式)以及分组的 CVPR 接收论文口头报告。我们将继续呈现精彩充实的会议内容,请继续关注。
雷锋网 AI 科技评论现场报道