雷锋网 AI 科技评论:作为人工智能 & 机器学习领域历史最悠久的学术会议之一,NeurIPS 2018 今年可说是花边不断,先是 9 月份开售的正会门票在 11 分钟内售罄,导致许多抢不到票的人士恨得心痒痒;再来便是迫于各方的声讨压力,组委会从 10 月份坚持「不改名」到 11 月份悄悄将官网名称 NIPS 替换成 NeurIPS ;一直到最近 Twitter 上又爆出相当一部分研究人员因为被加拿大拒签而无法参加会议,当中包括来自国内的学者。
无论如何,经历了一系列「水逆」的 NeurIPS 2018 终于要在今日正式开幕,凭借严谨的学术成果跟大家进行交流,雷锋网 AI 科技评论今日就带大家了解今年的会议有哪些值得关注的亮点。
会议详情
今年的 NeurIPS 在 2018 年 12 月 3 日(一)——2018 年 12 月 8 日(六)举行,地点位于加拿大蒙特利尔会展中心(Palais des Congrès de Montréal)。NeurIPS 2018 共计有 9 场 Tutorial 、7 场 Talk 、30 场 Oral 、168 篇 Spotlight 和 41 场 Workshop,华人学者主要见于 Oral(5 场)、Spotlight(47 场)及 Workshop(3 场)环节。其中 NeurIPS 2018 的 Tutorial 、主会议、Workshop 和 Competition Track 的具体举行时间如下:
Tutorial:12 月 3 日(一)——12 月 4 日(二)
主会议:12 月 4 日(二)——12 月 6 日(四)
Workshop:12 月 7 日(五)——12 月 8 日(六)
Competition Track:12 月 7 日(五)
今年大会主席是来自谷歌的研究科学家 Samy Bengio,他是深度学习领域大牛 Yoshua Bengio 的兄弟,在去年尚未改名的 NIPS 会议中担任大会程序委员会主席(Program Chair)一职。Samy Bengio 是谷歌大脑的核心领导成员之一,专注于机器学习领域,研究的对象包括 deep architectures 、表示学习、序列处理、语音识别、图像理解、大规模机器学习、对抗样本等内容。Samy Bengio 常年活跃于各大顶级人工智能会议(如 BayLearn、MLMI、IEEE、NNSP 等),同时也是 ICML、ICLR、ECML 和 IJCAI 会议的项目委员之一。
值得一提的是,今年的会议依然受到中国企业的青睐。我们在赞助名单中发现了 11 家来自中国的企业,其中百度、阿里巴巴、字节跳动和蚂蚁金服为铂金赞助单位;小马智行和华为为黄金赞助商;360、松鼠 AI、伏羲实验室、腾讯 AI Lab 和滴滴出行为白银赞助商。(NeurIPS 2018 赞助等级从高到低为:钻石、铂金、黄金、白银)
论文
据雷锋网 AI 科技评论了解,今年的 NeurIPS 收到了史无前例的 4856 篇投稿,相比去年的 3240 篇,增加了 50%;会议最终接受论文 1011 篇,接受率达到 20.8%,与去年持平;其中 Spotlight 共有 168 篇,占 3.5%,Oral 则有 30 篇,占 0.6%。
企业方面,会议的常年「霸主」谷歌今年依旧表现亮眼,Google Research 今年被收录的论文数量达到了 107 篇,占论文总收录量的 10.5%,远超排名第二、三的微软(46 篇)和 Deepmind(45 篇)。其中有实力在论文数量上与美国企业一争高下的国内企业是腾讯 AI Lab,它一共有 17 篇文章被 NeurIPS 2018 收录,榜上排名第六。
高校方面,MIT 以 68 篇的论文数量把所有高校甩在后头,勇夺第一,而斯坦福大学(57 篇)、CMU(53 篇)、加州大学伯克利分校(45 篇)、佐治亚理工学院(33 篇)则分别排在第二至五名。其中表现亮眼的国内高校是清华大学,它一共有 21 篇论文被 NIPS 2018 收录,榜上排名第十。
我们可以看到,今年「屠榜」NeurIPS 会议的依旧是来自美国的企业和高校,说明美国的科研能力依然处在世界领先水平。与之相对应的是,华人学者的影响力也逐渐在增强,无论是来自国内还是国外的单位,比如来自南京大学的张利军就有 3 篇论文被收录,CMU 教授邢波则是 8 篇,微软研究院的朱泽园 6 篇。(不完全统计)
大会演讲
今年的 NeurIPS 一共安排了 7 场 Talk,内容涵盖数据科学、机器学习、生物神经、强化学习、计算机系统设计等领域,雷锋网 AI 科技评论将详细的演讲详情整理如下:
《数据科学的问责机制缺失:为何我们应该建设具有包容性的人工智能》.《Lack of Accountability in Data Science: Why We Should All Be Building Inclusive AI》(主讲人:Atipica 创始人 Laura Gomez)
嘉宾将在演讲中为我们阐述分析数据在多样性上的缺失如何导致偏见算法的产生,由此产生有缺陷的产品,最终如何走向技术的不道德之路。
《当机器学习遇上公共政策:我们应该期望什么以及如何应对》.《Machine Learning Meets Public Policy: What to Expect and How to Cope》(主讲人:普林斯顿大学计算机科学与公共事务教授 Edward W Felten)
人工智能与机器学习如今已对世界产生了巨大的影响。政策的制定者们已经开始注意到这种变化,制定相关的法律法规以及跟相关人士展开对话来管理技术的发展。在演讲中,嘉宾会概述政策制定者们应对新技术变化的决策流程,以及这些政策将如何在人工智能与机器学习领域发展与落地,此外,他也将分享有建设性地参与政策过程将如何为人工智能领域、政府和社会带来「三赢」局面。
《你的身体在想什么:神经系统、原始认知、合成形态学以外的生物电计算》.《What Bodies Think About: Bioelectric Computation Outside the Nervous System, Primitive Cognition, and Synthetic Morphology》(主讲人:塔夫茨大学教授 Michael Levin)
大脑的计算能力并非我们所想象中的那般具有独特性。研究发现,细菌、植物和单细胞生物就展现出了学习方面的可塑性;神经系统速度优化的信息处理能力于生命之树中无处不在,且在神经元进化之前已经从多个维度上存在。需要强调的是,非神经计算对于单个细胞创造和修复复杂且大规模的人体结构而言尤其重要。我们发现,生物电信号能够使那些带有模式记忆的所有类型的细胞组成网络,来引导人体结构进行大规模的形成与生长。在这场演讲中,嘉宾将会简单介绍发育生物电领域的基础知识,并展示这个新概念与其方法上的成熟性,如何在不进行基因编辑的情况下使重写形态的模式记忆成为可能。实际上,这些策略可以让我们对实现多细胞模式目标的生物软件进行重编程。此外,嘉宾还将展示该策略在再生医学和认知神经可塑性领域的应用实例,并说明策略将如何对合成生物工程、机器人和机器学习的未来造成影响。
《具有可再生性、可重用、鲁棒性的强化学习》.《Reproducible, Reusable, and Robust Reinforcement Learning》(主讲人:麦吉尔大学副教授 Joelle Pineau)
这些年我们在深度强化学习方面取得了显著的成绩。然而,我们要想直接重现深度强化学习的显著效果依然面临着困难。此外,当环境或奖励机制具有很强的随机性时,一些高方差的方法将使学习变得困难。另外,领域或实验过程中出现小扰动有可能导致最终的结果不稳定。在这场演讲中,嘉宾将回顾深度强化学习领域在实验技术与汇报程序上面临的挑战,并提供可以让实验结果变得具有再生性、可重用性与鲁棒性的研究成果与指导方案。
《人工智能信任现象调查》.《Investigations into the Human-AI Trust Phenomenon》(主讲人:佐治亚理工学院计算机学院交互计算学院院长 Ayanna Howard)
随着智能系统在日常中与人类的接触变得频繁,我们有必要谨慎地审视信任在其中扮演的角色。在我们的研究中,信任主要传递了这么一个概念:当人类与智能系统进行互动时,往往会表现出与其他人类互动时类似的行为,可能会误解将他们的决定推迟到机器上的相关风险。偏见又进一步加剧了这种毁掉信任的潜在风险,这些智能系统正是通过模仿我们的思维决策过程来进行学习,由此继承了我们的隐含偏见。在这场演讲中,嘉宾将结合近期在实际场景中与人们进行互动的智能系统镜头来讨论这个现象。
《让算法更值得信赖:统计科学可以为算法的透明度、可解释性以及数据验证做些什么?》.《Making Algorithms Trustworthy: What Can Statistical Science Contribute to Transparency, Explanation and Validation?》(主讲人:剑桥大学数学科学中心的统计学家 David Spiegelhalter)
在自动化建议系统领域,对透明度、可解释性和数据验证的需求并非什么新鲜事。早在 20 世纪 80 年代,就已经存在基于规则的系统和基于更加透明的统计模型的系统之间的讨论(这些讨论有时还挺激烈)。基于药物开发的评估标准,我们建立了一个医疗咨询系统,其评估过程一共分为是分为四阶。最近,欧盟立法尤其关注算法的能力实现,在必要的情况下可以向其展示系统的运作原理。在 Onora O'Neill 的可信度展示强调以及「智能透明度」的理念启发下,我们可以在理想的情况下检测以下几点:
(a)算法的经验基础;
(b)过去的表现;
(c)当前推论的背后原理,其中包括临界点和假设;
(d)当前推论的不确定性,包括最新案件是否属于其职权范围。
再者,这些解释应该对不同水平的专家们开放。
这一演讲将通过 Predict 2.1 系统来进行说明,系统主要针对乳腺癌手术后选择辅助治疗的女性,该系统基于竞争风险生存回归模型,并与专业心理学家合作开发,与此同时还与临床医生和患者们保持着密切的合作。Predict 2.1 系统对于辅助治疗的潜在益处和危害共有四个层次的解释,目前在全世界每个月进行大约 25,000 个临床决策。
《为 Software 2.0 时代设计一款计算机系统》.《Designing Computer Systems for Software 2.0》(主讲人:斯坦福大学电气工程和计算机科学系教授 Kunle Olukotun)
通过机器学习从数据生成模型正在取代许多传统的软件开发方法。这种在软件开发方法上的根本性转变,姑且称作 Software 2.0,给我们的应用程序的质量和易部署性提供了显著的改进。为了让 Software 2.0 的辉煌得以延续,我们必须提供一款专门为机器学习应用量身定制,具有强大功能以及操作上高效灵活的计算机系统。嘉宾将在这场演讲中描述一种优化计算机系统以满足机器学习应用要求的设计方法。这种全栈式设计方法集成了针对应用程序特性和现代硬件优势的机器学习算法,针对可编程性和表现性能的特定领域语言和高级编译技术,以及有效实现高灵活性和高能量效率的硬件架构。
结语
作为人工智能 & 机器学习领域历史最悠久的学术会议之一,我们可以将会议中的成果视作人工智能领域的研究「风向标」。作为「最佳论文」强而有力的竞争者,今年的 30 篇 Oral 论文选题上主要集中在这几块内容上:神经网络/模块/损失函数的理论分析、反向传播及最优化过程、从策略到结构对强化学习的整体研究等。
随着会议的开幕,更多的学术成果将进一步揭开面纱,雷锋网 AI 科技评论接下来将继续保持关注,及时为大家送上第一手消息。