雷锋网按:转载自CKDD公众号。
KDD分论坛Data Science of China专题介绍
北京时间8月16日(美国当地时间8月15日下午),第22届国际数据挖掘大会(KDD 2016)在美国旧金山开幕。KDD(Knowledge Discovery and Data Mining)是世界数据挖掘和大数据领域最高级别的国际会议,今年的参会人数达到了2762人。KDD China在大会第一天的主会议程中组织“Data Science of China(数据科学在中国)”的分论坛,集中展现中国在数据挖掘领域的进展和华人在该领域的研究成果。
KDD 2016大会现场
Data Science of China论坛由China Chapter of ACM SIGKDD(KDD China)承办。由KDD China秘书长、微软亚洲研究院主管研究员郑宇教授,KDD China副会长、百度金融高级总监沈抖博士和Linkedin科学家Shipeng Yu博士共同组织。
论坛组织者:Dr. Shipeng Yu, Prof. Yu Zheng and Dr. Dou Shen(从左至右)
华人数据挖掘届六位ACM Fellow全部出席会议,他们是:伊利诺伊大学芝加哥分校的Philip Yu教授(1997年)、伊利诺伊大学香槟分校的Jiawei Han教授(2003年)、台湾大学陈铭宪教授(2006年)、伊利诺伊大学芝加哥分校Bing Liu教授(2015年)、西蒙弗雷泽大学的Jian Pei教授(2015年)和台湾大学林智仁教授(2015年),其中Philip Yu、Jiawei Han和Jian Pei三位教授进行了精彩的报告。论坛还邀请了七位来自数据挖掘领域杰出的华人教授、科学家以及工业界精英为大家共同奉献了一场华人史上最强数据挖掘论坛。
现场听众
当地时间下午1:45论坛开始,郑宇教授隆重介绍了各位重量级嘉宾,并对本领域同胞的到来表示由衷的感谢。随后他通过统计近7年来KDD文章录用情况和参会人员数据对华人在本领域做出的努力进行了展示和展望。从2010年至今,第一作者为华人的录用文章占总录用文章的45%左右,并程上升趋势,今年该比例更是高达56%,这个值得骄傲的数字反映了华人在该领域所做出的突出贡献,如下图。
历年华人第一作者文章数量占总数比
两岸三地的参会人数也从13年的102人增长到今年的168人,如下表所示,表示了国内的研究水平和能力的提升。
历年KDD两岸三地参会人数
另外郑教授还分享了一个有趣的数字,如下图所示,今年两岸三地被录用文章中偏理论研究(Research track)的文章数量大幅下降但偏应用(Applied data science track)的文章大幅上升,这是否是国内对于数据挖掘技术落地的渴望的风向标,我们有待进一步观察和验证。
国内文章历年track数量对比图
随后,论坛分两个议程进行,议程一由SIGKDD 主席Bing Liu教授主持。首先,滴滴研究院副院长Jieping Ye博士为大家分享了滴滴出行在数据挖掘领域的进展和研究成果,展示了大数据和数据挖掘技术如何更好地方便人们的出行。随后,郑宇教授介绍了数据挖掘在城市中的应用-城市计算,城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)的过程。郑教授通过一些实际工作进行了详细介绍。来自罗格斯大学的Hui Xiong教授带来了题目为“People Analytics in Human Resources”的报告,介绍如何将数据挖掘技术应用到人力资源管理领域,比如:利用数据对人才进行评价和意愿分析,以辅助升职考核、招聘等流程。Jian Pei教授分享了数据科学工具和平台的构建方法,并以同华为公司合作为例进行了详细介绍,说明了该平台如何管理华为的海量数据,并通过挖掘这些数据提升企业服务质量和用户满意度。最后,Jiawei Han教授给出了他最新的研究成果,从海量文本语料库中挖掘结构性内容,即用新颖的大数据的视角来解决自由语言处理中分词、语义分析等传统的问题。
论坛议程一报告者
论坛议程二由沈抖博士主持。首先,来自清华大学的崔鹏博士带来了他关于在大数据时代下,社交网络分析与挖掘中网络表示方法的重新审视和相应的应对策略方面的研究。同样来自清华大学的唐杰博士介绍了他的研究成果-AMiner,一个利用数据挖掘和社会网络分析技术提供科研服务的学术搜索系统,展示了如何运用学术信息和数据挖掘技术更好得帮助大家发现好的学术资源:如文章、作者和会议等。随后来自加州大学洛杉矶分校的Wei Wang教授进行了题为“Big Data Analytics in Bioinformatics Data”的报告,通过将不同传感器等资源获得的生物医疗信息进行融合,去理解人的健康状况,从而帮助医生进行诊断。
论坛议程二报告者
Philip Yu教授分享了脑网络挖掘的最新研究成果,他将人脑建模为一张图(Graph),希望通过大数据和图挖掘技术来帮助发掘和理解人脑的思维模式。另外,Philip Yu教授也是本届KDD大会创新奖(2016 ACM SIGKDD Innovation Award)的获得者,以表彰他在大数据下挖掘、融合和异常发现领域中做出的突出贡献。最后来自悉尼科技大学的Chenqi Zhang教授介绍了他的团队在大数据下的图处理和挖掘领域中做出的研究。
本届KDD大会创新奖获奖者Prof. Philip Yu
报告结束后,会议组织者与报告嘉宾合影留念。至此,KDD China组织的Data Science of China论坛落下帷幕。本次论坛是众多华人多年来努力的成果,祝愿通过本次论坛的召开能够扩大华人在国际数据挖掘领域的影响力,推动国内数据挖掘领域的研究和在工业界的应用和发展。
组织者及嘉宾合照