雷锋网 AI 科技评论按,CVPR 2018 将于 2018 年 06 月 18-22 日在美国盐湖城举办,除了主会议程,各式各样的 Workshop 也值得大家一探究竟。
其中,CVPR 2018 Visual Understanding of Humans in Crowd Scene (VUHCS 2018)Workshop 尤为亮眼,该 Workshop 由新加坡国立大学 LV 组联合美国卡内基梅隆大学、中国中山大学主办。今年,主办方在 VUHCS 2017 的基础上进行了延伸与拓展,除接收相关论文,还将迎来 5 项极具吸引力的比赛,主要针对人物解析与姿态估计等以人物为中心的视觉感知与处理任务。
当前,探索与研发自然场景下基于计算机视觉技术对人物进行全面理解的有效解决方案已成为计算机视觉领域的最根本问题,并对诸多工业应用领域(如自动驾驶、虚拟现实、视频监控、人机交互以及人物行为分析等)产生至关重要的影响。其中,人物解析与姿态估计通常被视为活动/事件识别/检测的第一步。然而,当前的计算机视觉技术发展与实际应用需求尚存在较大差距。
据雷锋网 AI 科技评论了解,VUHCS 2018 的举办初衷在于鼓励来自人物视觉理解领域及其他相关领域的专家、学者、老师、同学们展示他们的科研成果,共同探讨、交流、构思新想法、新方案,并由此推动和促进实际应用场景下的有关技术与系统的性能和实用价值。
VUHCS 2018 日程为期 1 天 (2018 年 06 月 18 日),阿里巴巴杰出工程师、副总裁华先胜,奇虎 360 首席科学家、人工智能研究院院长、副总裁颜水成,加利福尼亚大学伯克利分校教授 Trevor Darrell,约翰•霍普金斯大学教授 Alan Yuille 将受邀做主题报告。预期最终接收 20 篇海报文章,5 篇口头报告文章 (来自 5 项竞赛的冠军团队)。接下来雷锋网 AI 科技评论将带来详细信息:
Part 1 征稿信息
重要日期:
截稿:2018 年 04 月 15 日
审稿通知:2018 年 04 月 18 日
终稿提交:2018 年 04 月 20 日
会议:2018 年 06 月 18 日
投稿网址:
https://cmt3.research.microsoft.com/VUHCS2018
征稿范围:
本次征稿范围包含但不限于以下解决以人物为中心的视觉感知与处理任务的相关方向:
多人解析与姿态估计
基于单张(段)彩色/深度图像/视频的二维/三维人物姿态估计
自然场景下的行人检测
人物动作识别与轨迹识别/预测
多人视频与交叉视角相机下的人物重识别
三维人物形态估计与仿真
人物衣服与属性识别
监控视频下的人物重识别,人脸识别--确认/鉴别
用于性能评估与/或验证分析现有方法的新数据集
人物理解的有关前沿应用,包括:自动驾驶、事件识别与预测、机器人操作、室内导航、图像/视频检索与虚拟现实
此外,VUHCS 2018 还旨在其他有关人物综合分析的主题,如:人物部位的分割与识别、人物活动识别、三维人物形态生成,以及人群中的人物行为分析等,这些主题极具挑战性、实用性,贴合现实应用场景。
Part 2 竞赛信息
VUHCS 2018 包含单人解析、多人解析、单人姿态估计、细粒度多人解析与多人姿态估计共计 5 项竞赛。
其中前 3 项竞赛由卡内基梅隆大学与中山大学承办,后 2 项竞赛由新加坡国立大学 LV 组承办。
单人解析与姿态估计竞赛:主办方提供 50000 张带有 19 个语义类别像素级标注及 16 个二维关节点标注的图片数据。
多人解析竞赛:主办方提供 38280 张带有 19 个语义类别像素级标注的多人场景图片数据。
细粒度多人解析与多人姿态估计竞赛:主办方提供 25403 张带有 59 个细粒度语义类别像素级精细标注及 20 个二维关节点标注的多人场景图片数据。
与以往的比赛相比,VUHCS 2018 设置的问题更具挑战性与实用性:
不同于 ECCV16 Joint ImageNet and MS Coco Visual Recognition Challenge Workshop 的关键点预测竞赛,VUHCS 2018 的竞赛主要针对解决更加精细的像素级的人物解析与人物姿态估计,从而可以加强与促进更加复杂与细粒度的实际应用,如:虚拟现实中的三维人物形态生成等。
不同于 ChaLearn Looking at People Workshop on Apparent Personality Analysis and First Impressions Challenge 专注于显著性人格分析 (如:视频个性特征识别),VUHCS 2018 的竞赛着重于自然场景下的细粒度人物解析与姿态估计。
相关数据集已开放下载并开始接受参赛队伍注册及结果提交。更多详细信息请参阅 http://sysu-hcp.net/lip/ 和 https://lv-mhp.github.io/。
Part 3 Workshop 详情
议程安排:
08:30-08:40 开幕致辞与欢迎仪式
08:40-09:10 竞赛介绍与结果公示
09:10-09:25 口头报告 1:单人解析竞赛冠军团队
09:25-09:55 受邀报告 1:华先胜,杰出工程师/副总裁,阿里巴巴
09:55-10:25 海报展示与茶歇
10:25-10:55 受邀报告 2:颜水成,首席科学家/人工智能研究院院长/副总裁,奇虎 360
10:55-11:10 口头报告 2:多人解析竞赛冠军团队
11:10-11:25 口头报告 3:单人姿态估计竞赛冠军团队
11:25-14:00 午餐
14:00-14:30 受邀报告 3:Trevor Darrell, 教授,加利福尼亚大学伯克利分校
14:30-14:45 口头报告 4:细粒度多人解析竞赛冠军团队
14:45-15:00 口头报告 5:多人姿态估计竞赛
15:00-15:30 海报展示与茶歇
15:30-16:00 受邀报告 4:Alan Yuille, 教授,约翰·霍普金斯大学
16:00-16:30 颁奖典礼与总结展望
主办成员:
梁小丹,博士后,卡内基梅隆大学,xiaodan1@cs.cmu.edu/xdliang328@gmail.com
赵健,博士 (在读),新加坡国立大学,zhaojian90@u.nus.edu
李建树,博士 (在读),新加坡国立大学,jianshu@u.nus.edu
林倞,教授,中山大学,linliang@ieee.org
冯佳时,助理教授,新加坡国立大学,elefjia@nus.edu.sg
Eric Xing,教授,卡内基梅隆大学,epxing@cs.cmu.edu
程序委员会:
冯佳时 (助理教授,新加坡国立大学),Xiaohui Shen (高级研究员,Adobe),魏云超 (博士后,伊利诺伊大学厄巴纳-香槟分校),Jianchao Yang (研究员,Snap)。
附:关于新加坡国立大学 LV 组
新加坡国立大学 LV 组 (http://www.lv-nus.org/) 由颜水成教授创建、由冯佳时教授领军,是目前各大学术机构在深度学习与计算机视觉领域的顶级团队之一。其「人脸与人物视觉理解」团队一直是 LV 组中不可或缺的顶梁柱,屡创佳绩——在 LFW 人脸识别数据集首次达到 99.7% 的识别精度、在 NIST 2017 IJB-A 人脸验证与辨认两项竞赛中与新加坡松下研究院合作一起夺得冠军、在 CVPR 2017 LIP 人物解析与人物姿态估计两项竞赛中夺得亚军、在 ICCV 2017 MS-Celeb-1M 大规模人脸识别 Hard Set、Random Set 与小样本人脸识别三项竞赛中与新加坡松下研究院合作一起夺得冠军。此外,其首次提出多人解析 (Multi-Human Parsing: MHP) 任务,对传统的人物解析进行了拓展与延伸,从而更好地匹配现实应用场景。其构建并发布了首个全新的大规模多人解析数据集 (MHP v1.0 [1]),并给出了相应的评测标准与参考方法,并在此基础上进行不断扩充与优化,构建并发布了更大规模与细粒度的「增强版」多人解析数据集 (MHP v2.0),并给出了更加合理的评测标准与性能更优的参考方法 (相关论文将于近期公布),极大地推进了深度学习与计算机视觉领域相关技术的发展。
图:MHP v2.0 与 MHP v1.0 样例对比
参考文献
[1] "Multi-Human Parsing in the Wild", Jianshu Li*, Jian Zhao*, Yunchao Wei, Congyan Lang, Yidong Li, Terence Sim, Shuicheng Yan, and Jiashi Feng. arXiv:1705.07206 (* indicates equal contribution)
[2] "Generative Partition Networks for Multi-Person Pose Estimation", Xuecheng Nie, Jiashi Feng, Junliang Xing, and Shuicheng Yan. arXiv:1705.07422