在成功结束上海交大站、清华站活动之后,“GAIR大讲堂”第三期学术分享活动将马不停蹄地于本周六(8月26日)在哈工大深圳研究生院开幕。
上周六在清华的活动,得到了北京地区各大高校同学们的踊跃支持,100人的会议室被广大到场的观众们挤得爆满,下图为活动现场图:
(清华站现场照片)
4位嘉宾从CVPR 2017的学术成果到参会心得分享,为在场的同学们和企业观众做了专业而又精彩的介绍,同学们也积极参与了现场提问。嘉宾的耐心回答让同学们收获良多,以至于有同学在活动结束之后对主办方雷锋网表达了真诚地感谢,有微信截图为证:
从现场情况和同学们的反馈来看,想必对即将开始的哈工大站活动,你也会非常期待吧!要知道哈工大深圳站,主办方雷锋网以及承办方哈工大(深圳)计算机学院一同邀请了更多来自企业界的重磅嘉宾来分享他们在CVPR 上学术成果,这其中就包括AI明星企业的资深AI工程师们,相信企业嘉宾的分享也能让大家收获更多易于落地的研究思考。嘉宾介绍:
左旺孟 哈尔滨工业大学计算机学院教授、博士生导师
左旺孟老师,IEEE会员,中国计算机学会会员,国际期刊《ISRN Signal Processing》编委。主要从事图像增强与复原、稀疏表达和深度学习等方面的研究。在ACM CSUR、IEEE TIP等重要国际期刊和CVPR、ICCV、ICPR、ICIP等重要国际会议上发表学术论文40余篇。曾获得全国优秀博士论文提名奖、哈尔滨工业大学优 秀博士论文奖和国际会议优秀论文奖。
主题:Deep learning models for image restoration and depth enhancement (面向图像复原和深度图增强的深度学习模型)
分享内容:图像增强和复原是底层视觉的一个重要内容。近年来,以卷积神经网络为代表的深度学习模型在图像超分辨与去噪领域获得了巨大的成功。然而,如何将其推广应用至更多的底层视觉视觉问题,是我们近年来关注的一个重要方向。本次分享将围绕这一问题,介绍我们今年CVPR上的两个工作:
(1) 设计了一种新的去噪CNN网络,并结合半二次分裂方法将其推广应用于广义的图像复原问题的求解;
(2) 针对有引导图的深度图增强问题,设计了一种特殊的深度网络结构并利用任务驱动策略学习动态引导与增强模型。
黄伟林 码隆科技首席科学家
黄伟林博士来自牛津大学Visual Geometry Group(VGG),是首位从该实验室回国工作的研究员。博士后期间师从Andrew Zisserman和Alison Noble。研究方向主要集中在场景文本识别,场景分类和医学视频分析等领域。同时,他还担任计算机视觉/人工智能领域主要会议的PC member或者Reviewer,包括:ICCV、CVPR、ECCV、AAAI 等。黄伟林博士曾任中国科学院助理教授。
Matt Scott 码隆科技联合创始人兼CTO
Matt Scott 拥有十年微软研发经验,曾任微软亚洲研究院高级研发主管。Matt多年均为微软绩效排名前1%的杰出员工与管理者,拥有国际顶级学术会议论文13篇,超过40个中美专利技术,18个微软技术商业转化成果。其熟悉研发领域包括软件工程、视觉计算,机器学习,尤其擅长把最前沿计算机科学成果转化为服务大众的互联网产品。
分享题目:CVPR WebVision挑战赛分享与展望(论文分享)
分享摘要:CVPR期间WebVision大规模视觉理解全球挑战赛宣布赛果,码隆科技团队在全球超过100支参赛队伍中脱颖而出,荣获冠军。WebVision竞赛的主要挑战是数据来源于网络抓取,未经过任何人工标注,因此含有大量的错误类别标签。 码隆算法团队利用课程学习(Curriculum Learning)的思路,设计更加高效的训练策略,有效地抑制错误标签和数据不平衡的负面作用。在演讲中,码隆科技黄博士将分享此次竞赛的算法思路和方法方面的相关经验,以及针对现实场景中非人工标注数据的训练和学习技术的探索。
除此之外,Matt还将重点介绍ImageNet 与 Webvision两大学术比赛之间的区别,除此之外,将深入介绍WebVision 比赛的主要挑战,以及由WebVision 比赛引发的对智能视觉现实场景应用的探索。希望带领广大同学们更深入的了解和认识WebVision挑战赛。
陈晓智,清华大学博士
陈晓智博士毕业于清华大学电子工程系。他的研究兴趣为深度学习及其在三维感知中的应用。他曾在多伦多大学、百度自动驾驶事业部进行访问和实习,曾获清华大学优秀博士论文、博士生国家奖学金。
主题:Multi-View 3D Object Detection Network for Autonomous Driving (面向自动驾驶的多视角三维物体检测网络)
分享内容:三维物体检测是自动驾驶感知系统的关键问题。本文提出了一种多视角三维物体检测网络(MV3D),通过融合激光点云和RGB图像来实现物体的三维定位与检测。该模型将三维点云编码成多视角的表示,通过三维似物性网络来提取三维候选区域,并设计了一种深度融合网络来学习物体的多模态特征。该方法在KITTI评测集上取了领先的三维物体检测性能。
李琛 浙江大学工学博士
李琛于2017年6月获得浙江大学工学博士学位,师从周昆教授和微软亚洲研究院Steve Lin博士。他的研究方向为三维重建、计算摄影学、表观建模等计算机视觉、计算机图形学的交叉领域。2012年至2016年期间曾在微软亚洲研究院网络图形组实习。
主题:Biological Human Skin Color Model: from Theory to Applications (肤色生物学模型:从原理到应用)
摘要:人脸一直以来都是图像和视频中的最重要的呈现内容。因此,针对人脸的图像处理技术变得十分重要,并获得越来越广泛的学术和工业界关注。由于人类生理结构的相似性,使得人脸具有更多区别于一般物体的特征和约束可以被利用——肤色就是其中之一。李琛博士等人在CVPR 2017发表的两篇论文《Radiometric Calibration from Faces in Images》和《Specular Highlight Removal in Facial Images》,正是利用人脸肤色的生物学模型作为先验知识,与当今主流算法相比较,在高光分离、相机响应函数校准,这两个传统图像处理的重要问题上,效果获得显著提升。
活动时间地点:
8月26日下午2:00-6:30
深圳市西丽大学城哈工大校区A栋104教室
报名链接:(本活动仅限报名参加,名额有限抓紧时间报名)
小编温馨提醒大家:活动现场,主办方雷锋网将会送出5本《深度学习》书籍,精美奖品不容错过,快来报名吧!
往期活动直播回放地址:http://www.mooc.ai/course/151/lesson/list