近日,有名学者史定华(第一作者)、吕琳媛和陈关荣(通讯作者)共同在《国家科学评论》(National Science Review)上在线揭橥了名为《Totally homogeneous networks》的新文章。作者借鉴庞加莱的\"大众剖分\"大众思想,从圈构造的视角出发,把网络分解为全齐性子网络,并提出向量空间作为表示网络的新方法,以此首立异的网络研究框架。这项事情将代数拓扑引入网络科学的研究中,表示了物理、数学、打算机等多学科交叉领悟的代价。本文系对这一研究事情的解读。
论文原文:

Dinghua Shi, Linyuan Lü and Guanrong Chen, Totally homogeneous networks. Natl Sci Rev (April 2019) doi: 10.1093/nsr/nwz050.
https://doi.org/10.1093/nsr/nwz050
Tianlong Fan, Linyuan Lü and Dinghua Shi. Towards the cycle structures in complex network: A new perspective[J]. arXiv preprint arXiv:1903.01397, 2019.
https://arxiv.org/ftp/arxiv/papers/1903/1903.01397.pdf
网络无标度特性,或者更广泛而言网络的异质性,一贯是网络研究的热点——过去是研究热点,最近是争议热点:有人对无标度本身提出质疑,也有人否认它在现实网络中的普遍性。然而网络只有异质性该当被关注?异质性对网络构造和功能真的具有人们以是为的那么主要?
人们激烈地争议着研究内容和结论,却忽略了对付研究视角的稽核。或许这才是更主要的问题。越来越多的研究指出,在中不雅观和介不雅观尺度下,同质性的各种网络子构造,才是造成网络特性和功能差异的关键。
毫无疑问,网络具有度分布异质性,但这对付理解和研究网络远远不足。我们须要回过分来重新核阅网络研究的视角,跳出桎梏,纠正视角,锋利工器,为网络研究开辟更广阔的新天地。
一、繁芜网络与网络异质性
何谓“繁芜网络”?
所谓繁芜网络,即是将一个别系中的大量实体及它们之间的相互浸染关系分别表示为节点和连边后所得到的网络表示。无论这个别系来自自然界还是人类社会,例如大量病历的剖析处理、基因组测序、电力网络设计、交易数据剖析和社交网络好友推举等,都不用考虑这些实体间的交互关系在现实系统中表现出来的巨大差异,而从统一的视角对这些网络进行剖析和研究。
图1 网络繁芜性及其运用,来源[1]
网络科学的理论及方法让我们能够更加深入地理解繁芜系统的构造特色与蜕变机理,并对一些繁芜系统中的传统问题供应超越原有认知范畴的办理方案。
繁芜网络的独特之处在于它立足(大)数据,将超过打算机科学、生物学、物理学、社会学、经济学以及电子商务等多学科的专业观点和研究问题整合起来,以是在面对新兴的交叉科学难题时具有先天上风。
图2 不同类型的网络及其特性,来源[2]
繁芜网络有何用?
网络是一种非常高效的工具化、构造化的数据存储构造。人脑是一个巨大的网络,万维网也同样布局成网状,这些都解释了网络是描述数据的一种极具灵巧性的强大工具。网络科学能帮助人们设计更快、更有弹性的通信网络;能用于优化电力网络、电信网络和翱翔航线等根本举动步伐系统;可以为市场动态建模;能帮助理解生物系统中的同步;能用于剖析人们之间的社会互动……
图3 不同类型的网络及其特性,来源[3]
“异质性”从何而来?
图4 网络同配异配性示例,来源[4]
当我们提及繁芜网络的时候,一定绕不开节点和连边;当我们表示和打算网络的时候,一定绕不开毗邻矩阵或毗邻表。网络可以用毗邻矩阵来描述,矩阵的阶数为网络中的节点数,节点的邻居数称为节点度。毗邻矩阵的表示方法更随意马虎使人们从节点及其邻居构成的邻域星构造的角度去研究网络,如无标度特性[5]。
所谓毗邻,即直接相连。当我们研究矩阵和矩阵元素的时候,很多是在研究节点与邻居构成的邻域星型子构造,毗邻表亦复如是。以是这种网络表示办法本身,授予了我们一个“异质性”的视角——而这一点长久以来为人们所忽略。正由于我们一贯是从本身具有“异质性偏见”的视角研究网络的,以是不难明得为什么长久以来异质性的度分布会得到广泛关注。但对事物的剖析显然不能从单一角度进行,这样很随意马虎产生片面乃至禁绝确的结论,有如一斑窥豹,所见仅为一斑[6]。
不可否认,以无标度特性为代表的网络异质性研究,在过去二十年中一贯是网络研究的热点,也取得了丰硕成果。然而网络中只有异质性吗?答案显然是否定的,且近期对付无标度定义本身和干系结论争议四起[7-10]。导致这种争议产生的一个缘故原由,便是由于越来越多的研究创造这种异质性的、低维度的视角对付更加深刻地认知网络繁芜构造和行为还是远远不足的。
二、网络科学新方向
网络科学新视角:
圈构造
随着互联网技能发展及网络科学研究的深入,学者们创造基于星构造的传统认知模式已经不能知足现今各种网络和系统蜕变发展的现实及处理新近呈现出的科学问题,例如在线社交媒体上广泛存在的基于群组的“一对多”的信息传播模式、与人的高等认知功能干系的神经簇构造[11]、可控性网络子构造设计、局域物联网上的信息交流等等。
人们逐渐意识到网络的功能或各种动力学性子更多的与网络中的高阶拓扑构造、同质性子构造及网络的多个拓扑不变量等密切干系。由此转换现有的认知视角,探索并构建新的网络描述方法和研究框架,是为网络科学确当务之急。
受到庞加莱数学理念的启示,作者借鉴代数拓扑和拓扑图论的基本思想和工具提出了认知和描述网络的新视角——圈构造[12],把稳到这里的圈不仅包含一样平常意义上的封闭环状连边构造,也包括全连通构造,构成封闭空间的洞构造(图5c)。将网络的认知视角从节点度转移到圈之后,就会创造普遍存在的、同质性的全齐性子网络。这里,全齐性网络定义为各个节点度相等、周长相等、路和相等的一类网络。
全齐性网络的范例例子如图5所示。个中c为最小2-洞,g为8节点隔壁规则网络,h为10节点同步最优网络。
图5 全齐性子网络示例
不同于微不雅观尺度下的星构造,圈构造是一种中不雅观或介不雅观尺度下的网络构造,它超越了规模的限定,无论是三个节点构成的大略圈,还是300个节点构成的非冗余圈,亦或是基于封闭回路的更繁芜圈构造,都被纳入这一视角。
网络表示新方法:向量空间与边界算子
早在十九世纪末,庞加莱创造边界是区分圆盘、球面、轮胎面等几何体的关键。他先把几何体剖分成称为单(纯)形的基本组成部分(点,线,三角形,四面体,…),从而引入了同调群、贝蒂数等多种工具并推导出欧拉-庞加莱公式,即纯挚形的交错和即是贝蒂数的交错和。
图6 纯挚形
庞加莱的这一思想本色上是对繁芜的拓扑几何体做“剖分”,进而化繁为简进行求解。受此启示,作者对繁芜网络的构造进行类似的“剖分”,让庞加莱的数学理论顺理成章地运用于网络科学研究。之以是可以这样做,一个主要的缘故原由是,网络中大量存在的全齐性构造(图论称为团,拓扑学称为纯挚形),很多时候也是支持网络功能的主要根本构造。基于这些骨干单元,作者用一系列二元域上的向量空间来描述网络。
例如,以连线为基的向量空间C1,空间维数是连线数目;以三角形为基的向量空间C2,空间维数是三角形数目,等等。由于三角形的边是连线,它(C2)和以连线为基的向量空间(C1)作为两个相邻的向量空间可通过边界算子D2 : C2—>C1来建立关联,并用边界矩阵来表示和进行研究。
图7 网络剖分过程示例 来源[13]
图7展示了利用纯挚形将网络G(左上)剖分成复形(左下,由不同维度的纯挚形构成)的过程。当然,这个复形可进一步按照边界算子分解为多个纯挚形。
边界矩阵比毗邻矩阵具有更丰富的数学含义和更多的可用工具。例如,通过边界矩阵的秩可打算网络主要不变量之一的贝蒂数,即网络无关k洞的数目,从而确定网络的同调群Zk/Yk。图9给出了边界算子和干系子空间的关系示意图。
图9 一系列向量空间和边界算子以及子空间的关系,来源[5]
笔者认为,以往的星构造紧张是基于静态的构造去研究网络的,网络的蜕变要通过不同的矩阵表现出来;而圈构造将交互关系视为网络的实质,它立足于动态的功能对网络展开研究。在一定程度上,可以说圈便是交互本身,它依托于构造但不完备等价于构造。正如它所表示的交互关系,除了表示在直接连边上,还包括圈上的非直连节点间的交互。以是,星构造与圈构造在哲学上也值得深入研究。
代数拓扑的引入,是对现有网络研究模式的主要补充,也是对当前研究窘境的重大打破。作者们重新的认知视角——圈构造,依托于新的网络描述工具——(不同维单形构成的)向量空间,立足于现有的网络科学理论和方法并借鉴拓扑剖分的思想,将在全维度上对网络科学进行更深入的探索。
三、拓扑方法的广阔运用
实际上,这一趋势已经在多个领域崭露出来,如数据挖掘领域中拓扑数据剖析(Topological Data Analysis,简称TDA)的兴起,机器学习中图网络(Graph Network)的提出,以及在数据库领域图形数据库的盛行等,都清楚地显现出这个席卷各个领域的浪潮的来临。
拓扑数据剖析
拓扑学研究的是一些分外的几何性子,这些性子在图形连续改变形状后还能连续保持不变,称为“拓扑性子”。而在繁芜的高维数据内部也存在着类似的构造性子,我们可以形象地称之为数据的形状。
拓扑数据剖析便是用拓扑学的理念方法对数据进行剖析和信息挖掘。比较于主身分剖析、聚类剖析这些常用的方法,TDA不仅可以有效地捕捉高维数据空间的拓扑信息,还能够有效降落大规模数据处理的维度(而不丢失高维的信息)。
图10 拓扑数据剖析示例,来源[14]
人们认为繁芜数据中存在着内在固有的低维构造,由它们按照某种办法构成数据的高维形状。要理解数据的高维形状,就必须乞助于拓扑剖析。利用拓扑数据剖析数据的过程,类似于拼图的过程——给你的只是拼图碎片,你要利用碎片间的关系拼出原来的完全图景。
目前这一方法已被用于基因表达数据剖析,数据及图片的压缩感知,罕见病患者筛查以及办理评级缺失落问题等。
点击查看干系推文:从拓扑数据剖析到压缩感知——繁芜数据处理新贵
图网络
图网络是机器学习与拓扑数据剖析相结合的最新产物。图网络是在拓扑空间(Topological space)内按图(Graph)构造组织以进行关系推理(Relational reasoning)的函数凑集,即一种基于图构造的广义人工神经网络。
图11 图卷积神经网络示例,来源[15]
众所周知,机器学习本身是一种“黑箱”,这也是用机器学习进行数据研究时所遭受的最紧张批评,虽然它们能自动供应有用的答案,但是却不能给人类供应可解读的输出。因此,我们每每不能理解它们是如何做到的。但图网络的引入,为机器学习的关系归纳偏置过程供应了一个操作构造化知识和产生构造化行为的直接界面。这为机器学习中的关系推理、组合泛化以及更繁芜的、可阐明的推理模式奠定了根本——这有望为人工智能黑箱供应可阐明性。图网络使我们能够理解神经网络如何实行分类任务,许可我们不雅观察网络的学习办法。
这一最新的前沿方向正在节点嵌入(如Node2Vec),图嵌入(Graph embedding)(此两者均为向量空间中提取的单一维度)等方向快速发展,将对机器学习与人工智能产生深远影响。
干系推文:
图网络——悄然兴起的深度学习新浪潮
深度学习新星 | 图卷积神经网络(GCN)有多强大?
从图嵌入到图分类——图网络入门综述
图形数据库
图12 图数据库示例,来源[16]
不同于主流的MySQL, Oracle等关系型数据库,图形数据库是一种运用图形理论存储实体之间的关系信息的新型数据库。在传统的关系型数据库中用表来存储“关系型”数据,但厥后果并不好,查询繁芜、缓慢、超出预期。然而这些数据间的关系是现实天下中普遍且至关主要的一部分。图形数据库的独特设计正好填补了这个毛病,它将构造化的数据存储在网络上而不是表中。
图13 不同类型数据库比较,来源[17]
在图数据库中,这些联系是非常易于存储和查询的。此外,常日很多事物之间的联系(例如家庭成员之间的关系)构成剖析问题的关键,利用图数据库使得问题剖析变得大略。
代数拓扑不但能在关系数据库的布局中起到辅导浸染,也能在基于图形数据库存储的数据剖析中发挥巨大浸染。
除了以上方面,代数拓扑与繁芜网络的结合也在其他学术和家当领域呈现出来,并正对干系领域产生深远影响。
干系事情
作者们的探索最早源于2002年由汪小帆和陈关荣创造的网络同步准则[18]。那么,什么样的网络最随意马虎同步呢?2013年,史定华,陈关荣和阎小勇等[19]通过优化引入了全齐性网络,创造周长越长、路和越短的全齐性网络在网络规模相同情形下同步能力最优。2016年,吕琳媛和周涛[20]等借助H算子建立了节点的度,H-指数和核数的内在联系,即网络的DHC定理。
在研究圈数指标的过程中,新近一项主要事情是Bassett研究组的Sizemore等人[11]于2018年揭橥的对大脑功能网络的实证研究,他们创造了网络中团和洞的分外主要性。
2019年,范天龙,吕琳媛和史定华[12]提出圈构造的网络研究新视角,并对基于圈的指标进行了系统研究,提出刻画网络圈构造的圈数矩阵和衡量节点主要性的圈指标。
同年,史定华,吕琳媛和陈关荣[5]提出向量空间与边界算子,定义了网络中的拓扑运算与拓扑不变量。
一起走来,从源于物理的网络同步准则,经由优化导出了全齐性网络,其主要性得到大脑网络的实证考验,终极归结为代数拓扑的不变量指标。这一系列的成果本身就表示了物理、生物、数学等多学科交叉领悟的意义和网络科学的代价,也预示着网络科学在代数拓扑的加持下,将重新抖擞更刺目耀眼的光彩。
参考文献
http://cgzh.seiee.sjtu.edu.cn/cgzh/minfo/2539_98.htm?n=1?n=1
http://www.lincoln.ac.nz/Research/Research/RC/CSBII/?sti=1
Michael S , Peterson J M , Borbala M , et al. Graph Theoretical Model of a Sensorimotor Connectome in Zebrafish[J]. PLoS ONE, 2012, 7(5):e37292-.
http://networksciencebook.com/chapter/7#impact-of-degree
Dinghua Shi, Linyuan Lü and Guanrong Chen, Totally homogeneous networks. Natl Sci Rev (April 2019) doi: 10.1093/nsr/nwz050.
https://baike.baidu.com/item/%E4%B8%80%E6%96%91%E7%AA%A5%E8%B1%B9/4700797?fr=aladdin
Shi D. Critical thinking of scale-free networks: similarities and differences in power-law random graphs[J]. National Science Review, 2014, 1(3): 337-338.
Broido A D, Clauset A. Scale-free networks are rare[J]. Nature communications, 2019, 10(1): 1017.
https://www.barabasilab.com/post/love-is-all-you-need
https://www.baidu.com/link?url=H90VhjEGHnoqQjFx0rFOW0AEOt9Ft2D3byWUq27rv37wrh0Y3rtcCjgFlDCg8exIKTpUYDpsoi34TfOUpk7b_TRtJ0MwL42dFJJ55G2T2iuiakaLezOLE-kiHfugrOlLTF_O3ccxQN82yP-zWXfU_K&wd=&eqid=9098e2de0027a595000000055cfb2f1f
Sizemore A, Giusti C, Kahn A, et al. Cliques and Cavities in the Human Connectome[J]. Journal of Computational Neuroscience, 2016, 44(1):115-145.
Fan T, Lü L, Shi D. Towards the cycle structures in complex network: A new perspective[J]. arXiv preprint arXiv:1903.01397, 2019.
Sizemore A E, Karuza E A, Giusti C, et al. Knowledge gaps in the early growth of semantic networks[J]. 2017.
Lum P Y, Singh G, Lehman A, et al. Extracting insights from the shape of complex data using topology[J]. Scientific Reports, 2013, 3:1236---.
Defferrard, Michaël, Bresson X, Vandergheynst P. Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering[J]. 2016.
https://en.wikipedia.org/wiki/Graph_database#/media/File:GraphDatabase_PropertyGraph.png
https://www.nextplatform.com/2018/09/19/the-graph-database-poised-to-pounce-on-the-mainstream/
Wang X F, Chen G. Synchronization in scale-free dynamical networks: robustness and fragility[J]. IEEE Transactions on Circuits and Systems I: Fundamental Theory and Applications, 2002, 49(1): 54-62.
Shi D, Chen G, Thong W W K, et al. Searching for optimal network topology with best possible synchronizability[J]. IEEE Circuits and Systems Magazine, 2013, 13(1): 66-75.
Lü L, Zhou T, Zhang Q M, et al. The H-index of a network node and its relation to degree and coreness[J]. Nature communications, 2016, 7: 10168.
作者:范天龙
审校:史定华、吕琳媛
编辑:王怡蔺
推举阅读
论文解读:繁芜网络的多尺度动态嵌入技能
Nature 通讯:繁芜网络如何化繁为简?
论文速递:作为繁芜网络的深度学习系统
Barabási组Nature封面:繁芜网络如何3D打印?
加入集智,一起繁芜!
集智俱乐部QQ群|877391004
商务互助及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索"大众年夜众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更剧烈些吧!










