春节快乐！10 场 AI 学术公开课伴你过新年

2019/02/05 21:06

雷锋网 AI 科技评论按：2018 年，AI 研习社为大家呈上了一系列公开课，让更多的 AI 学术人员得以分享、传播自己的研究成果，也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识，为国内人工智能长期持续发展的氛围出一份力。

在这阖家团圆的日子里，我们特意整理出 10 场传播热度最高的公开课，让错过直播的童鞋得以查缺补漏，而看过直播的童鞋也能借机温故而知新。

1. 图像分割的经典算法

分享嘉宾：

刘汉唐，浙江大学计算机系博士生在读，阿里巴巴 iDST 实习生。研究方向是计算机视觉、深度学习。

分享内容：

图像分割是计算机视觉中一个经典并且基础的问题，对于理解图像非常关键。图像分割有很多应用场景，比如无人驾驶、地图重建、图像美化等等。深度学习使得图像分割有了巨大的发展，本次分享会介绍深度学习中图像分割的经典算法。

回看网址：

http://www.mooc.ai/course/414/learn#lesson/2266

2. 深度学习时代的场景文字检测与识别

分享嘉宾：

姚聪：于华中科技大学电信学院获得学士和博士学位，其主要研究方向为自然场景文字检测和识别。在国际重要期刊 IEEE TPAMI, IEEE TIP 以及顶级会议 CVPR、ICCV 和 ECCV 等上发表论文十余篇。目前在旷视科技 (Face++) 担任云服务业务算法负责人，主持自然场景 OCR、人脸活体检测等技术的研发工作，为 FaceID 互联网身份验证服务、Face++开放平台等提供算法支持。

分享内容：

图像语义分割是 AI 领域中一个重要的分支，是机器视觉技术中关于图像理解的重要一环。近年的自动驾驶技术中，也需要用到这种技术。车载摄像头探查到图像，后台计算机可以自动将图像分割归类，以避让行人和车辆等障碍。随着近些年深度学习的火热，使得图像分割有了巨大的发展，本文为大家介绍深度学习中图像分割的经典算法。

回看网址：

http://www.mooc.ai/open/course/605

3. 物体检测算法的近期发展及开源框架介绍

分享嘉宾：

陈恺，香港中文大学多媒体实验室博士生，COCO 2018 Instance Segmentation Challenge 冠军团队成员。

分享内容：

物体检测是计算机视觉的基础任务之一，讲者将总结深度学习背景下物体检测算法的发展，分享 COCO 比赛冠军团队所使用的算法，并介绍由港中大多媒体实验室开源的物体检测算法框架 mmdetection。

回看网址：

http://www.mooc.ai/open/course/604

4. 研习 U-Net——现有的分割网络创新

分享嘉宾：

周纵苇，亚利桑那州立大学生物信息学在读博士，师从 Jianming Liang 教授，主要研究方向为医学图像分析，深度学习等。其研究工作曾在 CVPR，DLMIA，EJNMMI Research 发表。

分享内容：

经典的 Encoder-Decoder 结构在目标分割问题中展现出了举足轻重的作用，然而这样一个相对固定的框架使得模型在感受野大小和边界分割精度两方面很难达到兼顾。本次公开课，讲者以 U-Net 为案例分析，总结现有的分割网络创新，以及探讨还有哪些有针对性的改进方向。

回看网址：

http://www.mooc.ai/open/course/549

5. 高效卷积神经网络的结构设计与探索

分享嘉宾：

黄高博士，现为美国康奈尔大学计算机系博士后，主要研究领域为深度神经网络的结构设计与优化算法，以及深度学习在计算机视觉与自然语言理解中的应用；获得北京航空航天大学自动化学院学士学位，清华大学控制科学与工程博士学位。其博士论文被评为中国自动化学会优秀博士学位论文以及清华大学优秀博士论文一等奖。目前已发表学术论文 20 余篇，其中一篇被中国科学技术信息研究所评选为 2015 年全国百篇最具国际影响学术论文；一篇获得国际计算机视觉顶级会议 CVPR 的最佳论文奖。

分享内容：

卷积神经网络则是深度学习最具代表性的模型，在计算机视觉和自然语言翻译等领域有着极其广泛的应用。随着精度以及复杂度的逐步提升，卷积网络的推理效率问题越来越明显的成为制约其在实际应用中的瓶颈。本次 GAIR 大讲堂将从网络结构设计与推理方法等方面，分享黄高博士近期的一些研究成果与心得。

回看网址：

http://www.mooc.ai/open/course/423

6. 深度学习在点云分割中的应用

分享嘉宾：

王薇月，南加州大学计算机系在读博士，导师是 Ulrich Neumann 教授，主要研究方向为计算机视觉，三维视觉等。其研究工作曾在 CVPR、ICCV、ECCV 等发表。个人主页：www-scf.usc.edu/~weiyuewa/

分享内容：

随着激光雷达，RGBD 相机等 3D 传感器在机器人，无人驾驶领域的广泛应用，深度学习在三维点云数据的研究在近两年取得了广泛关注。点云分割、识别、检测成为学术界、工业界的热门话题之一。是在本次公开课中，讲者将分享其关于点云分割的最新工作。

回看网址：

http://www.mooc.ai/open/course/501

7. 基于小波变换的图卷积神经网络

分享嘉宾：

徐冰冰，中国科学院计算技术研究所在读博士生。目前主要研究兴趣为图卷积网络，图上深度学习。

分享内容：

Graph 是实际生活中广泛存在的数据结构，如社交网络，交通网络等。近年来如何利用深度学习的方法建模 Graph 引起广泛关注，而其中借助图卷积网络建模 Graph 上节点关联是非常重要的一类方法。本次公开课将分享如何用小波变换实现图卷积算子，以及小波变换相对于图上傅立叶变换带来的优势。该工作已被表示学习国际会议 ICLR2019 录用，论文题目为《Graph Wavelet Neural Network》。

回看网址：

http://www.mooc.ai/open/course/626

8. 基于最大熵的 CTC 改进算法

分享嘉宾：

刘鹄，清华大学自动化系硕士，目前就职于京东，主要研究搜索广告的排序模型。硕士期间导师是张长水教授，主要研究方向为序列识别、视频识别。工作曾在 CVPR，NIPS 等顶级会议上发表。

分享内容：

该工作是我们在 NIPS2018 上的一篇文章 (Spotlight)。

Connectionist Temporal Classification(CTC) 是一种广泛应用于优化序列识别问题的损失函数。结合 RNN/LSTM 等结构，目前 CTC 已经成为语音识别、光学字符识别、手势识别等领域的主流框架之一。然而 CTC 的训练过程存在一些缺陷，导致它比较容易过拟合，并经常倾向于输出过度自信、呈尖峰分布的预测结果。本次公开课将首先回顾 CTC 算法，指出它在训练过程中的缺陷，并结合最大熵从两个不同的角度为它提出改进。

回看网址：

http://www.mooc.ai/open/course/621

9. 稀疏流形变换（The Sparse Manifold Transform）

分享嘉宾：

陈羽北，UC Berkeley AI Research (BAIR) 博士在读。2012 年本科毕业于清华大学电子工程系，毕业后就读于加州大学伯克利分校电子工程与计算机系，并获得数学系硕士双学位，目前在导师 Bruno Olshausen 教授指导下研究非监督稀疏特征学习研究。

分享内容：

稀疏编码 (Sparse Coding)，流形学习 (Manifold Learning) 是早期两种非常重要的非监督学习方法，在神经科学，机器学习及数据可视化等方面都取得了相当的成功。讲者认为，稀疏编码从本质上刻画自然信号中的低维离散性，而流形学习则刻画的是自然信号中的低维连续性。在本次公开课上，讲者将介绍这两种模型中的重要联系，进而讨论讲者发表在 NeurIPS 2018 的文章稀疏流形变换（The Sparse Manifold Transform），首次尝试将这两种模型融合所建立的一套新的非监督特征学习框架。

回看网址：

http://www.mooc.ai/open/course/623

10. 基于对抗学习和知识蒸馏的多模型集成算法

分享嘉宾：

沈志强，UIUC 访问学生，复旦大学博士，已在 CVPR，ICCV，ECCV，ICLR，AAAI 等顶级会议上发表多篇论文。

分享内容：

该工作是我们最近刚发表在 AAAI 2019 (Oral) 上一篇文章。通常来说，集成多个基础级别的神经网络会带来更好的性能提升。遗憾的是，存储这些网络参数所需的空间以及在测试时执行它们所需要的时间，严重阻碍了它们在测试集很大情况下的使用，如 ImageNet。在本章中，我们提出了一种将大型的、复杂的神经网络集合压缩到单个网络中的方法。具体而言，来自各个训练好的深度神经网络 (Deep Neural Network，DNN) 中的知识被提炼并转移到单个 DNN 中。为了从不同的训练好的模型 (教师模型) 中提取不同的知识，我们提出使用基于对抗学习的策略。我们定义了一个逐块 (block-wise) 的训练损失函数，以指导和优化预先定义好的学生网络，学习教师模型中的知识，并使用鉴别网络同时区分来自教师或者学生网络的特征。

分享网址：

http://www.mooc.ai/open/course/620

雷锋网 AI 科技评论雷锋网