AI 科技评论按:2018 年 1 月 5-8 日,国际网络科学会议 NetSciX 2018 在浙江杭州召开。本次会议是网络科学系列会议首次在中国举办,由网络科学协会(The Network Science Society)主办,杭州师范大学阿里巴巴商学院承办。本文为雷锋网 AI 科技评论特邀作者、北京邮电大学张镇平撰写的解读稿件,未经许可不得转载。
网络科学是研究现实中的复杂网络的学术研究领域,比如通信网、计算机网络、生物网络、认知和语义网络等等,在该学科中用点代表组成网络的元素,用边代表节点之间的关系和相互作用,并在此基础上研究网络的演化过程、拓扑结构、动力学性质等。
网络科学是一个典型的交叉学科,融汇了多个学科的理论和方法,包括数学中的图论、物理中的统计力学、计算机科学中的数据挖掘和信息可视化、统计学中的推理建模以及社会学中的社会结构理论。美国国家科学研究委员会定义网络科学为「研究物理、生物和社会现象的网络表示方法,最终建立这些复杂现象的预测模型」。(详情可参考维基百科:https://en.wikipedia.org/wiki/Network_science)。
网络科学应用前景广泛、发展迅速,引起了各国政府和知名学者的关注,中国计算机学会理事长李国杰院士在 2016 年中国计算机学会通讯中发表了题为「网络科学: 21 世纪的元科学」的主编评语,指出数据科学与网络科学是一对孪生学科,两者相辅相成,李国杰院士强烈建议信息领域的学者参与到网络科学的研究中,文中写道,「网络科学不仅是真正的科学,而且将成为物理、生物、社会等众多科学的基础」。网络科学是数据驱动的科学,从现象反推到机制、再预测现象,如果说现阶段的人工智能,特别是深度学习还是一个灰箱的话,那么网络科学有可能成为打开这个箱子的钥匙之一。
国际网络科学协会是由网络科学奠基人 Barabási 等人发起的国际性研究协会,汇集了来自于各个学科背景,而对网络科学感兴趣的研究者。协会每年举办一次年会 NetSci,至今已经召开了 12 届,历届会议举办地点如下:
NetSci 2017, Indianapolis
NetSci 2016, Seoul
NetSci 2015, Zaragoza
NetSci 2014, Berkeley CA
NetSci 2013, Copenhagen
NetSci 2012, Evanston IL
NetSci 2011, Budapest
NetSci 2010, Boston MA
NetSci 2009, Venice Italy
NetSci 2008, Norwick UK
NetSci 2007, New York NY
NetSci 2006, Bloomington IN
由于网络科学发展迅速,为了满足交流的需要,协会另外开辟了网络科学年会的姐妹会议NetSciX,至今已举办了3届,历届会议举办地点如下:
NetSciX 2017, Tel-Aviv
NetSciX 2016, Poland
NetSciX 2015, Rio
今年的 NetSciX 会议分为两个部分,1 月 5 日为讲座学校,大会邀请了国际顶级学者为刚步入网络科学研究领域的学生和青年学者提供多场基础讲座。6 日-8 日为大会时间,包括特邀报告、大会报告、分会报告以及海报四个部分。此外,大会邀请业界的专家,举办多场不同主题的小型研讨会,打破学界与业界之间的研究壁垒,让学界和业界得到充分的交流。
本次大会邀请到了一系列的学界大牛做主旨演讲,包括:
Albert-László Barabási——Northeastern University 教授,APS Fellow,网络科学奠基人,无标度网络提出者
陈关荣——香港城市大学教授,IEEE Fellow,欧洲科学院院士
Raissa M. D'Souza——University of California 教授,APS Fellow,网络科学协会主席
Jürgen Kurths——Potsdam Institute for Climate Impact Research 教授,APS Fellow,欧洲科学院院士
Ying-Cheng Lai——亚利桑那州立大学教授,APS Fellow
Luciano Pietronero——University of Rome 教授
谢宇——普林斯顿大学教授
Jianwei Zhang——汉堡大学教授
除此之外,还邀请了网络科学领域杰出的中青年学者做特邀报告,包括:
Sarika Jalan——Indian Institute of Technology Indore 副教授
Hawoong Jeong——Korea Advanced Institute of Science and Technology 教授
李翔——复旦大学教授
Filippo Radicchi——Indiana University 教授
Marta Sales-Pardo——Universitat Rovira i Virgili 副教授
James Gleeson——University of Limerick 教授
王大顺——Northwestern University 副教授
周涛——电子科技大学教授
四天的时间里,在网络科学领域覆盖的范围内,数十位国内外顶级学者分别讲述了一个或几个不同的研究方向,可谓场场干货。
下面我们来集中回顾一下讲座学校的主要内容(按分享时间顺序总结,排名不分先后)。讲座学校邀请了国际顶级学者为刚步入网络科学研究领域的学生和青年学者提供四场基础讲座,分别是:
(1)复杂网络和疾病传播;
(2)基于网络和控制论视角的人类微生物群研究;
(3)网络中的大规模结构:隐藏社区和潜在层次结构;
(4)多层网络研究。
Vittoria Colizza 来自法国国家健康与医学研究所,演讲的内容聚焦于网络科学的经典话题——传染病传播,因为在疾病传播中的基础研究和数据驱动的网络建模方面的开创性工作获得 2017 年度的 Erdős–Rényi 奖,该奖以随机图理论的开拓者 Erdős 和 Rényi 命名,由网络科学协会颁发给在网络科学领域做出杰出贡献的年轻科学家。(个人主页:http://www.epicx-lab.com/vittoria-colizza.html)
Colizza 主要介绍了 2007 年发表在 BMC Medicine 的工作。2002-2003 年 SARS 在全球肆虐,清楚地显示了长程运输网络对于理解疾病爆发的重要性。作者结合大规模的交通数据来更好地对现实中的疾病传播过程进行建模。
为了评估模型的预测能力,作者以 SARS 的全球传播为例进行了预测。参数和条件初始化采用了香港的实际数据,同时分析了爆发可能性和传播路径。仿真结果很好地拟合了 SARS 的全球传播情况。
Colizza 对演讲进行了总结,远程移动和人口统计变量对于提升疾病传播模型的预测能力,而且可以持续地进行检验。这种建模策略可以作为全球疾病传播的分析和预测的一般方法,为遏制疾病传播、避免灾难性后果提供决策支持。
Liu 是哈佛医学院的副教授,同时任布莱根妇女医院副研究员。他的研究兴趣广泛,包括人类菌群和社区生态、复杂系统的控制原则、复杂网络的结构和动力学、生物信息学和机器学习,本次演讲聚焦于用网络科学方法和控制论研究人类微生物群。(个人主页:https://scholar.harvard.edu/yyl)
该演讲以 2016 年发表于 nature 的论文「Universality of human microbial dynamics」为主要内容。人体微生物社群决定着我们的健康和幸福,近年来持续研究基于微生物群的治疗方法,如排泄物微生物群移植。这些微生物群是非常复杂、动态和个性化的生态系统,在物种组合和丰富度方面展现出高度的个体多样性。至今未解决的问题是,用人口动力学模型中的增长率、种内和种间交互度量,这些微生物群背后的生态动力学到底是一致的还是个性化的、依赖于宿主而变化的。如果微生物群动力学是依赖于宿主的生活方式、生理机能和基因的,那么通用的微生物干预措施将会带来不可预知的结果,使得措施无效甚至带来灾难性的后果。或者,微生物群也可能服从普适性的规律。
Liu 等提出了新的刻画人类微生物群特征的计算方法,并应用于来自两个大规模的元基因组研究(人类微生物群项目和学生微生物群项目,缩写为 HMP 和 SMP)。结果显示,肠道和口腔菌群展示出普适性的规律,而与特定皮肤部位相关的菌群受到宿主差异性的影响。如下图,除了 SMP 研究中的前额和手掌,HMP 研究中左右肘窝,其他部位的菌群都具有差异性。
Larremore 是卡罗拉多大学的助理教授,在数学和统计物理方面有扎实的基础和丰富的研究积累,同时在卡罗拉多大学计算机系和生物前沿研究所任职。(个人主页:http://danlarremore.com/)
Larremore 首先从结构发现的意义入手,科学在于寻找规律,将复杂的现象简单化,而结构便是区别于噪音的信息,帮助我们理解哪些是网络的重要组成部分以及这些部分是如何连接组合成整体的。现有的研究采用同配系数和模块度来度量和发现社区结构,然而,模块度概念虽然清晰、简单,却存在悖论,因为即使是随机网络也可以划分出具有高模块度的社区。生成网络模型是常用的研究方法,一方面可以根据模型和参数来重现实际数据,另一方面可以从实际数据中推断中网络的生成过程和参数。
最后,Larremore 介绍了社区发现中的研究前沿话题:
分层社区(hierarchical communities),我们观察到的网络是重叠交叉的,但是却可以按照节点类型、时间等对网络进行分层,更好地揭示网络结构和规律;
混合划分 (mixed-membership),在这种划分方法下,边表示隶属关系,而节点根据所连接的边被划分到不同群体;
多层网络 (multilayer networks), 多个网络叠加,除了传统网络中的节点和边,增加了一个所属网络层级的属性;
综合元数据的社区划分(metadata+communities),元数据即关于数据的数据,通常是数据的描述信息,如节点的标签(人的性别、地域、身高、体重等),这些信息可以作为约束条件帮助进行更好地划分社区。作者认为需要在通用模型和定制模型中做出权衡,科学问题会不断驱动新的社区划分方法的出现。
Bianconi 教授来自伦敦玛丽女王大学,研究兴趣包括网络统计力学、生物网络、凝聚态物质中的复杂和临界现象。报告聚焦于多层网络的结构和动力学,成果于 2014 年发表在物理学领域的权威杂志 Physics Reports(Structure and Dynamics of Multilayer Networks)。(个人主页:http://www.maths.qmul.ac.uk/~gbianconi/)
如果我们细心观察周围,就可以立即发现,生活中形形色色的现象都是基本元素之间通过复杂的模式不断交互而产生的。网络科学将基本元素抽象为节点,将节点之间的互动抽象为边,帮助我们理解现象,发现规律,进而找到控制网络的方法。
传统的复杂网络方法不区分点和边的类型,严重限制了网络的实际应用,为此作者列举了三个实际网络进行说明。
(1)Facebook 好友关系网络。两个用户在 Facebook 上成为好友,可能是因为他们是同事,或者是同一个足球队的粉丝,再或者是因为他们经常在假期见面,而这些不同的好友关系在信息传播中所起的作用是不同的。如果一个人得到了一个消息并希望传播出去,那么他所选择的传播渠道明显是不同,因此更合理的方式是对每一种社会关系形成的团体都建立一个网络,进而对不同网络之间的传播做出限定。
(2)航空网络。人们在航班延误时需要重新安排行程,而首先考虑的是原航班所在航空公司的航班,这时网络是分层的,每一家航空公司的航线网络构成一层,人们优先选择所处的网络重新安排行程。
(3)生物网络。生物学家详细观察新杆状线虫的神经网络,包括 281 个神经元和 2000 多个连接,这些连接分为两类:化学连接和离子连接,而这两类连接具有完全不同的动力学特性,这导致神经元在不同层上表现的性质和重要性完全不同,如果不区分边的类型对节点进行排序将会得到错误的结论。
作者按照常见的书籍撰写结构综述了现有的多层网络研究:
(1)多层网络的结构,介绍了常用的数学概念来定义多层网络,包括中心性、聚集系数、特征谱、模体、相关性等;
(2)多层网络的网络生成模型,包括生成多元网络和网络的网络;
(3)多层网络的鲁棒性和渗流,特别是考虑网络之间相互依赖性下的渗流过程;
(4)多层网络上的传播过程和进化博弈;
(5)多层网络上的同步现象;
(6)多层网络在社会科学、技术、经济、气候预测、生态学和生物医学方面的应用。
作者最后对多层网络的研究进行了总结和展望,多层网络无疑是复杂网络研究的前沿课题,表现出与单层网络迥然不同的性质,呈现出许多有意义的新规律,如研究发现网络之间的相互依赖是系统脆弱性的根源之一,未来的研究可以针对上述综述内容更加深入地展开研究。
AI 科技评论总结:本次讲座学校邀请了四位杰出的青年科学家来介绍了近年来的研究前沿,包括两场复杂网络的基础研究讲座(网络结构、多层网络)和两场复杂网络在重要领域的应用研究(疾病传播预测、微生物群研究)。
一天的时间里,4 位学者分别从各个角度对复杂网络科学进行了详细的、全方位的解读。
从学员的角度来看,可以发现在原来以物理学、数学为主的网络科学研究人员基础上,新增了来自计算机学科、生物学科、医学的研究人员,网络科学研究团体不断多元化、学科之间深度互动。这是网络科学自身的魅力和潜力的展现,同时也是网络科学不断蓬勃发展的动力所在。