2017年7月17日上午,中国图象图形学学会主办的CSIG图像图形学科前沿讲习班第二期(IGAL 02)在清华大学闭幕。本次活动由西安交通大学、清华大学和深蓝学院联合承办,西安交通大学的薛建儒教授和清华大学的马惠敏副教授担任学术主任,为期3天的讲习班共有来自全国各地的210多位老师、同行参加。
7月15日上午,讲习班第二期“智能驾驶与机器视觉”在中国图象图形学学会理事长谭铁牛院士的致辞中,正式拉开序幕。
▲ 中国科学院院士、中国图象图形学学会理事长谭铁牛
谭铁牛院士强调,学会举办讲习班的目的在于引领图像图形学领域的学科发展,特别是向各位同行介绍这个领域以及相关领域的重要发展方向和前沿方向,提供接触和了解的平台,使同行对领域前沿方向有基本的了解和把握,有机会针对一些前沿的问题展开研讨。
▲ 西安交通大学教授薛建儒
西安交通大学的薛建儒教授在致辞中强调,机器视觉在自动驾驶中的应用还有很大的提升空间,为此,此次讲习班邀请了在自动驾驶、机器视觉领域知名的学者授课。
本次讲习班共邀请了业界11位知名学者作学术报告。
15日上午,清华大学智能技术与系统国家重点实验室的孙富春教授首先开讲,分别从研究背景、认知机器人、机器人阵列感知、机器人的视触觉表征、机器人的视触觉融合、基于经验学习的灵巧操作以及研究展望等7个部分讲述了视触觉数据感知与处理。
接下来,天津理工大学副校长陈胜勇教授为大家带来了“视觉系统的光照问题”的精彩报告,报告揭示了机器系统中主动照明控制的重要性,总结了机器视觉系统中的照明因素和条件,提出了视觉传感器的合适状态,并提出了机器视觉的照明策略和自适应控制方法,以达到最佳的场景理解效果;此外,报告中陈教授跟大家探讨了如何获得视觉传感器运行的舒适条件等一系列重要问题。
下午,南开大学的方勇纯教授以“智能平台视觉控制”为主题,向大家介绍了视觉控制方面的背景知识,并重点讨论了基于位置的视觉伺服、基于图像的视觉伺服等多种视觉控制方法在移动机器人、微纳操作机器人、无人飞行器等智能平台上的实际应用。
来自清华大学智能车猛狮团队的张新钰以“智能驾驶技术技术研究及实践”为主题,做了当天最后一场报告。他从智能驾驶的发展历史、关键技术、产业化和实践4个环节为大家做了详细的介绍。在“智能驾驶关键技术”环节中,张新钰从目标感知、场景认知、定位系统、基于AI的自主决策和基于MPC的协同控制等方面介绍了智能驾驶涉及的一些相关技术,并展示了团队的科研实践成果,结合自身的实践,探讨了智能驾驶对未来行业和产业的影响。
▲ 第1天特邀讲者
16日上午,上海大学无人艇工程研究院院长谢少荣教授作了“海洋无人艇智能控制技术”的精彩报告,报告首先综述了海洋无人艇国内外研究发展情况,着重介绍美军无人艇技术水平;接着介绍了团队针对研制无人艇面临的岛礁海域水流紊乱、海洋噪声、障碍物林立的技术挑战,在无人艇自主控制方面的研究进展,以及在岛礁海域、南极罗斯海等进行海洋地形地貌探测、海底目标探测、海洋环境保障、海底掩埋物探测等成功应用。
接着,上海交通大学杨明教授阐述了“基于感知地图的智能车定位方法”,这种新兴的定位方法首先离线采集传感器数据,通过SLAM等方法离线创建全局传感器地图,然后通过地图匹配的方法在线获取高精度车辆定位信息。与传统GPS定位方法相比,适用范围更广,已在国内外主流无人车上得到大范围应用。
下午,中科院自动化所的喻俊志研究员讲解了“基于嵌入式视觉的仿生机器鱼跟踪控制”,报告从具有嵌入式视觉的仿生机器鱼系统设计入手,研究了机器鱼的头部平稳性控制、基于人工地标的三维定位、基于视觉的三维跟踪控制、基于强化学习方法的目标跟随控制等,并且通过实验分别验证了所提出算法的可靠性与有效性,并对未来机器鱼的研究方向和工作重点进行了分析和展望。
西北工业大学王琦教授作了“视觉智能感知在无人系统与视频监控中的应用”的精彩报告,王教授首先介绍了视觉技术在无人系统与视频监控中的应用概况,然后针对目标检测/识别/跟踪与人群行为分析等问题,重点介绍了近年来在交通标志、行人、车辆识别等方面的研究工作,最后以Demo形式对相关成果进行了展示。
中科院自动化所的吴怀宇带来了下午最后一场报告,他以“基于机器视觉的3D智能建模与场景重建”为主题,主要讨论了基于图像的全自动视觉重建方法,并展示了基于单张照片人脸全自动重建系统。
▲ 第2天特邀讲者
17日上午,讲习班现场依然火爆,清华大学电子工程系的马惠敏介绍了“三维场景图像认知与智能驾驶”,她报告主要讲述了针对数据驱动的机器学习在不确定的复杂场景图像识别中的困难,通过建立自顶向下的认知先验数学模型,创新性地将其引入基于自底向上的数据驱动的机器学习中,提出了多模态多视角多任务3D场景图像深度学习认知方法3DOP、MV3D等,用于复杂驾驶场景中三维物体检测,使错误率下降了50%。
浙江大学计算机辅助设计与图形学国家重点实验室的章国锋以“复杂环境下的视觉同时定位与地图重建”为主题作了讲习班最后一场报告,主要与大家分享了课题组为了解决‘高效地获得尽可能长而且准确的特征轨迹并将多视频序列之间的复杂回路闭合’、‘对于海量图像/视频数据在有限的内存下如何进行全局优化’、‘在动态环境下如何进行鲁棒的同时定位与地图构建’等关键问题所做的研究工作以及一些相关应用,并对视觉SLAM的发展趋势做了展望。
▲ 第3天特邀讲者
11位讲者们的精彩报告激发了大家的研究兴趣和热情,通过相互交流扩展了视野。
雷锋网新智驾作为本次活动的首席合作媒体,参与了全程报道,后期会有更多总结文章陆续放出,敬请关注。