ACM SIGKDD 2017(知识发现与数据挖掘会议)于 8 月 13 日至 17 日在加拿大哈利法克斯正式召开。雷锋网AI科技评论将从一线带来精彩报道及内容。
会议前一天下午,雷锋网AI科技评论来到现场签到时,发现主要的指示标志和前台接待设施已经布展完毕,也有不少与会人士陆续到现场签到。
大会主席 Stan Matwin 、Yu Shipeng 及副主席 Faisal Farooq 分享了本次大会的一些感想:
「我们希望 KDD 2017 能够让您了解新的技术趋势,从论文(包括 poster 及口头展示)中得到启示并在专业领域有所助益,发现新的工具、研究流程及实践工作;确定新的工作机会或是招聘到心仪的人选。」
「数据科学」、「数据挖掘」和「大数据」,在过去几年中已经从研究实验室走出,并出现于你我的日常生活中,甚至也出现在媒体领域和各级政府和企业的决策中。这些技术的影响涉及到每一个人。更重要的是,目前数据科学的快速发展得到了极大的推动——包括工业界人士及学术界人士。在过去,这些人一直是 KDD 会议的一道风景线,他们是理论与实践的桥梁,是双界交流的促进者和催化剂。在会议上,包括研究、应用数据科学及应用演讲嘉宾等三个平行议程将会同期展开,将工业界与学术界人士紧密联结在一起。
而这也正是 KDD 2017 的议程所具备的。雷锋网了解议程后发现,延续往年的惯例,KDD 2017 将非常大的比重留给了 tutorial 和 workshop 环节(第一天和第二天)。22 个各具特色的 tutorial 将从深度学习、数据挖掘、IOT 实战应用等不同方面提供前沿观点,此外还将穿插 8 个半天的 hands-on tutorial;而 22 个 workshop 则将在第二天进行;正会则要等到第三天才开始。
每年会议的Keynote自然是最重要的一个部分,KDD邀请了三个 Keynote 嘉宾,分别从数据挖掘的不同角度分享了工业界和学术界的前沿和未来:
Cynthia Dwork,微软研究院杰出科学家/哈佛大学:《何谓公平?》
数据,算法和系统中都嵌入了偏见,它反映了设计师的明显和隐藏的选择,历史偏见和社会的优先等级。 它们在字面上就不可避免地形成了价值观。 算法的“不公平”,例如从广告到再犯预测的不同任务,已经在大众媒体中引起了相当的关注。 这次演讲将讨论针对初期的数学严谨的分类和评分的公平性研究。
微软研究的杰出科学家Cynthia Dwork以严谨的数学基础为隐私保护数据分析而闻名。 这项工作的基石是差异隐私,强大的隐私保证通常可以获得高度准确的数据分析。 Dwork还在加密和分布式计算方面做出了突出贡献。 她是美国国家科学院和美国国家工程学院的成员,也是美国艺术与科学学院院士,美国哲学社会学者。 从2017年1月开始,Dwork将是哈佛保尔森工程学院计算机科学系的Gordon McKay教授,拉德克利夫高级研究所的Radcliffe Alumnae教授,以及哈佛法学院的教授。
Bin Yu,UC 伯克利大学教授:《数据科学的三原则:可预测性、稳定性与计算性》
在这个演讲中,我将讨论数据科学的三个原则在数据驱动决策中的重要性和联系。预测的最终重要性在于,未来是所有人类在商业,教育,研究和政府方面任何活动的独特而且可能是唯一的目的。机器学习以预测为中心,以计算为核心,已经实现了广泛的数据驱动方面的成功。预测是检查现实的有用途径,良好的预测暗示着过去和未来之间的稳定发展。稳定性(相对于数据和模型扰动)也是数据驱动结果的可解释性和可重复性的最低要求。它与不确定性评估密切相关。显然,如果在没有可行的计算算法的条件下,是不能采用预测和稳定性的原理,因此可见可计算性的重要性。这三个原则将由分析联系来表明,同时两个正在进行的项目中证明,“数据智慧”也是不可或缺的。具体来说,第一个项目采用深度学习网络(CNN)来了解难辨视觉皮层V4中神经元的模式选择性;第二个项目通过采用和比较不同潜变量模型和基于拉索的模型来预测政治电视广告的党派和语气。
Bin Yu是加州大学伯克利分校统计学和电气工程与计算机科学系的教授,也是伯克利统计局前任主席。她是北大统计与信息技术大学微软联合实验室的创始人之一。她与基因组学,神经科学和医学科学家进行跨学科研究。为了解决这些领域的数据问题,她开发了统计学和机器学习方法/算法和理论,并结合领域知识和定量批判性思维进行整合。Bin Yu是美国国家科学院院士,美国艺术与科学学院成员。她是2006年的古根海姆 Fellow,2011年ICIAM的邀请演讲人,2012年伯努利社会的图基纪念讲师,以及2016年立陶宛数学统计研究所讲师。她在2013 - 2014年担任IMS总裁,并且是IMS、ASA、AAAS、IEEE Fellow。
Renee J Miller,多伦多大学教授:《数据集成的未来》
数据集成时的形成的数据爆炸的价值。 在这次演讲中,我提出过去二十年来数据整合方面的一些重要创新。 这其中包括数据交换,其为推理转换数据的正确性以及在集成中使用声明映射提供了基础。 我还讨论了数据挖掘如何用于促进数据集成,并呈现数据科学中出现的一些重要的新数据集成方面的挑战。
RenéeJ. Miller是多伦多大学计算机科学系教授,加拿大贝尔信息系统主席。她是加拿大皇家学会、加拿大国家学院院士,ACM Fellow。她获得了美国科学家和工程师的总统早期职业奖(PECASE),这是美国政府颁发的优秀科学家和工程师从事职业生涯的最高荣誉。她获得NSF职业荣誉奖,总理研究优秀奖和IBM教授奖。她的研究主要在数据集成和数据管理领域。她和共同作者因为2003年颇有影响力的建立了数据交换的基础的文章而获得了ICDT测试时间奖。她曾担任VLDB基金会董事会成员,并担任捐赠基金会主席。她的研究由NSERC,NSF,IBM,SAP和Bell Canada等资助。她从威斯康星大学麦迪逊分校获得计算机科学博士学位,并获得麻省理工学院数学和认知科学学士学位。
此外,有 11 位专家及教授将从应用数据科学的角度阐述他们在数据科学领域的研究心得,名单如下:
而至于一直以低收录率闻名的KDD,今年的投稿结果如何呢?官方统计数据如下:
今年的 KDD 研究领域的审核总论文数为 748 篇,收录 130 篇,包括 64 篇 oral,66 篇 poster,录用率分别占 8.6% 及 8.8%。
而应用数据科学领域共审核 390 篇论文,收录 86 篇,包括 36 篇 oral,50 篇 poster,录用率分别占 9.2% 和 12.6%。
论文详细收录名单如下:http://www.kdd.org/kdd2017/accepted-papers
钻石赞助商:滴滴;
顶级赞助商:亚马逊、微软、阿里巴巴、facebook;
金牌赞助商:SAS、Captial One;
银牌赞助商:Criteo Research、谷歌、Element AI、西门子、Linkedin
铜牌赞助商:华为、Booking.com、Honenywell、American Express、Oracle、Western Digital。
其他赞助商详见官网页面:http://www.kdd.org/kdd2017/sponsorship
值得一提的是,为了让更多的学生和初创企业能够减轻经济负担来到现场,KDD 2017 提供了 14.5 万美元学生差旅经费和 25 万美金的初创企业经费。「我们希望 KDD 2017」将会成为能让研究者、实践者、投资者的聚集之地,创造出更多创新算法及商业化的产品。」
雷锋网AI科技评论也将从KDD 2017前线带来更多消息。