深度学习近年来对数据科学产生了革命性的影响。基于计算能力的提升、数据来源的延展及编程框架的进步,深度神经网络已经无处不在。目前深度学习的相关方法在如计算机视觉、语音识别及生成、自然语言处理等多个领域取得了领先进展,也正在将它的应用领域延展至其它研究当中,取得更大的应用优势。
而在 KDD 2018 大会同期举办的首个 key event——Deep Learning Day,毫无疑问成为了本次大会倍受关注的重点议程。据官方介绍,这个首次在 KDD 举办的「深度学习日」,是 KDD 大会历史以来第一个围绕深度学习所组织的全天议程,旨在对深度学习提供学术与工业融合的最新研究发展概述,包括如图卷积神经网络及计算最优传输等众多新兴的研究主题。
本次 Deep Learning Day 的组织者包括:Anima Anandkumar(Caltech /Amazon)、Jure Leskovec(斯坦福),东昱晓(微软研究院),胡侠(德州农工大学),以及 Joan Bruna(纽约大学)。
Deep Learning Day 的核心议程是十名特邀讲者的报告,包括三个 Keynote 演讲及七个主题演讲,每个演讲时长均为 45 分钟。同期收录的 32 篇论文也主要是以交流为主,不作专门的口头报告。「一个专注的主题,一个更大的空间,」Deep Learning Day 的组织者之一、德州农工大学助理教授胡侠博士(Hu "Ben" Xia)如是总结道,「我们可以把 Deep Learning Day 理解为一个『super workshop』, KDD 2018 第一次将原本分散的深度学习相关 workshops 融合成一个大的议程,本质上也是一种议程设置的创新。」
据雷锋网 AI 科技评论了解,Deep Learning Day 实际上从去年就已经开始规划筹办,直到今年才正式与 3000 余名参会者见面。从学术大环境与大会规划上,增设 Deep Learning Day 这一议程有着两方面的重要考虑。
首先是深度学习的广泛应用有目共睹,KDD 组委会认为有必要增设一个单独环节专门对深度学习的相关研究进行讨论;其次,鉴于 KDD 本质还是一个基于知识发现与数据挖掘的顶级学术会议,组委会并不希望让深度学习的「风头」盖过多样化的数据挖掘研究方向,因此将深度学习的相关议程独立出来,也有益于数据挖掘领域的健康发展。
Salesforce / Stanford 的 Richard Socher 在做题为《The Natural Language Decathlon: Multitask Learning as Question Answering》的 Keynote 演讲
Deep Learning Day 当天 Keynote 的演讲嘉宾包括来自特斯拉的 Andrej Karpathy、Deepmind 的 Oriol Vinyals 及 Salesforce / Stanford 的 Richard Socher 等三位工业界知名的研究者;主题演讲则更多涵盖高校领域,包括 MIT 的 Tamara Broderick、密歇根大学的 Qiao Zhu Mei、NYU / Facebook 的 Kyunghyun Cho、USC 的 Yan Liu、谷歌的 Ali Rahimi、Facebook 的 Soumith Chintala 及乔治亚理工大学的宋乐。
值得一提的是,特斯拉的 Andrej Karpathy 在演讲时也向观众们表示,这是他第一次受邀以讲者的身份参加 KDD 的首个 Deep Learning Day,着实颇具意义。
从邀请的嘉宾中不难发现,Deep Learning Day 的十位讲者基本都是产学双栖的中青年讲者,他们作为研究的中坚一线力量,能为与会的观众们提供最新的思考。这一点得到了胡侠博士的证实,组织者们在邀请演讲嘉宾的过程中,也综合考虑了多方面的因素。「第一,我们希望讲者要有横跨工业界与学术界的丰富经验,即使是工业界大牛,也有着比较强的研究背景;其次,讲者们需要覆盖多个深度学习目前做得比较不错的主题,如视觉、健康、自动驾驶等;再者,还要兼顾深度学习的理论内容,做到理论应用相融合。」
而从现场的参会情况来看,Deep Learning Day 的首次「亮相」无疑颇具成效。场地选择的是用来举行 KDD 2018 开幕式的最大场馆,当天据雷锋网 AI 科技评论估计,有近千人参与了这个「超级 workshop」;而从组委会反馈的情况来看,也有一部分与会者就是专门冲着 Deep Learning Day 而注册参会的。这自然给予了 KDD 2018 组委会一个很大的鼓励,也为下一年的 Deep Learning Day 提供了宝贵的经验参考。
有了第一年的成功经验,在未来 Deep Learning Day 可能发展成为 KDD 的一个特色议程吗?胡侠博士向雷锋网 AI 科技评论分享了自己的一些观点。
KDD 2018 举办 Deep Learning Day,本质上是希望通过将与深度学习相关的内容剥离出来,让 KDD 更纯粹地成为一个数据挖掘的相关会议。「目前收到的正面反馈很多,我们也在考虑是否将 Deep Learning Day 的规模进一步扩大,但组委会对此还是表现得相当谨慎,至少不会在议程的比重上对深度学习的重要性进行『肯定』。」
其次,在 Deep Learning Day 的具体议程设置上,组委会也在考虑是否减少深度学习的理论分享,以强化数据挖掘的核心主题。这些思考也能够进一步地帮助下一年的 KDD 做更符合实际情况的议程制定,我们也期待明年 KDD 的 Deep Learning Day,可以给我们带来更多惊喜。