全局检索与知识浏览
跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页,做语义追问和来源核验。
本研究系统考察了具有功能连接的公共交通网络(PTN)中尚未实现的部分,即其补图结构。无权图 $G$ 的补图 $\bar G$ 是一个标准概念:它与 $G$ 共享同一节点集,且当且仅当某条边在 $G$ 中不存在时,该边才存在于 $\bar G$ 中。相比之下,加权补图无法被唯一确定。然而,若将 PTN 的边权重定义为行程时间,则其可能取值范围受到物理约束。我们提出一种方法,基于节点(代表车站)间的地理距离,并结合网络特异的有效速度分布与候车时间分布,构建运营中 PTN 图表示的加权补图,并据此为边赋予权重。我们发现,加权补图中中心性最高的节点,并非原网络中中心性最低的节点,而是位于网络地理中心但拓扑连通性较弱的节点。在涵盖全球31个地铁网络的数据集上,通过与零模型对比验证表明,该现象本质上是一种空间效应。
在复杂系统中,事件以不规则的时间间隔发生,这些间隔本质上编码了系统的内在动力学。分析事件的时间聚类能够揭示非随机模式及时间演化特征。现有技术可通过全局统计量有效量化事件的整体聚类倾向,但这些宏观方法存在关键缺陷:未能深入探究单个聚类的动力学特性。分析单个聚类至关重要,因为它有助于理解主动驱动系统动态的局部相互作用,而这些作用可能被全局平均所掩盖,同时还能揭示涉及的时间尺度。为解决上述局限性,我们提出一种基于复杂网络的框架,用于分析不规则时间间隔下事件的聚类行为。该框架利用到达时间建立连接,将时间序列转化为网络结构,并通过网络属性量化聚类特征。此外,采用社区检测算法识别时间序列中的个体聚类。我们通过标准到达过程(如泊松过程和马尔可夫调制泊松过程)验证该方法的有效性。为进一步展示其适用范围,我们将该方法应用于两类不同系统:湍流中液滴到达的时间序列以及心电图(ECG)信号中的R-R间期序列。
随机游走是分析复杂网络化系统(如社交网络、生物系统和通信基础设施)的基本工具。经典随机游走聚焦于成对交互,而许多现实系统天然呈现高阶交互,更适合用超图建模。现有超图随机游走模型多局限于无向结构,或未引入基于熵的推断,因而难以刻画复杂系统中的方向性流动、不确定性或信息扩散。本文构建了一种面向有向超图的最大熵随机游走框架,涵盖两类交互机制:广播式(一个中心节点激活多个接收节点)与融合式(多个中心节点共同影响一个接收节点)。我们通过 KL 散度投影方法,在满足随机性和平稳性约束条件下推断转移核;所得最优性条件表现为乘性缩放形式,并采用 Sinkhorn–Schrödinger 类型迭代结合张量缩并实现。我们进一步分析遍历性:广播式对应投影线性核,融合式则依赖张量谱准则刻画其多项式动力学行为。该框架的有效性通过合成数据与真实世界案例得到验证。
发现大规模凝聚子图是图挖掘的一项关键任务。现有模型(如团、k-plex 和 γ-准团)采用固定的密度阈值,忽略了连通性随子图规模增大而自然衰减的特性。Flexi-clique 模型通过施加一个随子图规模亚线性增长的度约束,克服了这一局限。本文对 Flexi-clique 进行了算法研究,证明其为 NP-难问题,并分析其非遗传性(non-hereditary)性质。为应对计算挑战,我们提出了两种算法:一是 Flexi-Prune 算法(FPA),一种基于核(core)初始化与连通性感知剪枝的快速启发式算法;二是高效分支限界算法(EBA),一种融合多重剪枝规则的精确求解框架。在大规模真实网络与合成网络上的实验表明,FPA 以显著更低的开销实现近似最优质量,而 EBA 能高效计算精确解。因此,Flexi-clique 为在复杂网络中发现大规模、有意义的子图提供了一种实用且可扩展的建模方法。
基于时间序列测量,重构编码模型变量间影响关系的参数,是复杂网络耦合系统理论中一个尚未解决的重要问题。本文针对一类含噪声的领导者-跟随者共识算法,提出该问题的一种解决方案:仅可获取跟随者节点的测量数据,而无法观测领导者节点。利用此类系统的有向拉普拉斯耦合结构,我们推导出观测动力学的自回归展开式,并可根据领导者的记忆长度在不同阶数处截断。当领导者记忆较短时,在附加若干消除重构退化性的系统假设下,该方法可准确重构包含隐藏领导者智能体的完整动力学矩阵。我们通过数值模拟验证了该理论,分别考察了单个及多个隐藏领导者的情形。
大型复杂网络中超越成对关系的高阶交互通常建模为超图。分析超图属性(例如三元组计数)至关重要,因为超图能够揭示传统图模型无法捕获的复杂群体交互模式。在现实场景中,此类网络往往规模庞大且动态演化,带来显著的计算挑战。由于缺乏专用软件包与数据结构,大规模动态超图的分析迄今仍基本未被探索。受此研究空白驱动,我们提出 ESCHER——一种以 GPU 为中心的并行数据结构,用于高效且可扩展的超图演化表示(Efficient and Scalable Hypergraph Evolution Representation),旨在高效管理大规模超图的动态演化。我们还设计了一种超图三元组计数更新框架,在动态操作中最小化冗余计算,同时充分挖掘 ESCHER 的能力。我们在多种超图三元组计数类别上验证了该方法的有效性,包括基于超边、基于关联顶点以及时序三元组。在多个大规模真实世界及合成数据集上的实验结果表明,所提方法显著优于现有最先进方法,在基于超边、基于关联顶点和时序三元组三类任务上分别实现了最高达 104.5×、473.7× 和 112.5× 的加速比。
同步模式表征网络的一种状态,其中节点依据其同步动力学组织为若干簇。这些同步簇可进一步呈现活性或非活性状态。同步节点的活性簇与非活性簇同时保持不变,构成一种动力学约束:活性簇产生的涨落必须相互抵消,才能使某一特定簇维持非活性状态。我们通过利用网络结构中的置换对称性,并选取相空间中内部动力学与耦合函数均为奇函数的动力学形式,证明该结构与动力学的组合可产生由共存的活性簇与非活性簇构成的稳定不变模式。网络中的对称性导致活性簇彼此处于反同步状态,从而使与这些反同步簇相连的簇所受涨落相互抵消。我们利用全网络对称性确定同步簇,而利用商网络对称性识别簇的共存活性-非活性状态。结果表明,随着节点间耦合强度变化,各活性簇在不同耦合值处相继失去活性,网络由此在不同活动模式之间发生转变。文中以范德波尔(Van der Pol)振子与斯图尔特-兰道(Stuart-Landau)振子网络为例进行了数值模拟。最后,我们将主稳定性框架(master stability framework)推广至此类模式,并给出了其存在的稳定性条件。
本文提出一种计算框架,通过将拓扑数据分析(Topological Data Analysis, TDA)与方程自由法(Equation-Free Method)相结合,探索并分析复杂基于智能体的网络模型的宏观动力学行为。为验证该方法的有效性,我们将其应用于Erdős–Rényi型随机网络。本方法的核心是基于TDA的滤波过程,该过程以激活网络节点(即智能体)的密度为驱动变量,并从中提取一个粗粒化的宏观拓扑可观测量;该可观测量由持续同调Betti数定义,从而在显著降低数据维度的同时保留关键拓扑特征。随后,在方程自由法框架下,我们首先证明可利用拓扑性质实现\textit{提升过程}(lifting procedure),其次构建一个数据驱动的演化律,用以刻画该宏观变量的动力学行为。最后,我们开展数值分岔与稳定性分析,以探究所涌现宏观动力学的整体行为及其定性转变。
我们研究了在几何非均匀随机图(GIRGs)上的多数投票意见动态,该模型是空间复杂网络的强大表征。与经典粗化动态中通常达成全局共识的情况不同,我们的模拟表明,足够大且局部集中的意见区域不会消失。相反,它们趋于稳定,导致竞争性意见的持续共存。为理解这种被抑制的粗化机制,我们构建并分析了一个两个意见区域界面的可处理均值场模型。我们的主要理论结果在均值场分析中严格证明了界面轮廓存在一个稳定且非平凡的极限分布。这表明意见边界处于静止状态,为复杂网络几何结构如何在社会系统中支持稳健的意见多样性提供了数学解释。
影响最大化(IM)是复杂网络分析中的基础性问题,具有广泛的实际应用场景。迄今为止,现有IM方法在识别关键节点时主要依赖于标准图模型,难以刻画许多现实系统中固有的高阶交互关系。超图可更有效地建模此类高阶交互。然而,采用超图可能导致搜索空间过大及级联动力学建模复杂度升高,从而难以准确识别关键节点。为此,本研究提出一种基于离散粒子群优化(Discrete Particle Swarm Optimization)算法与阈值模型(threshold model)的新型超图建模IM方法。在该方法中,一个粒子(即候选解)表示种子节点的选择信息;适应度函数通过双层局部影响近似机制,对种子节点的影响范围进行准确且高效的评估。我们还提出一种基于度数的初始化策略以提升初始解质量,并设计了融合局部搜索的粒子速度与位置更新规则,以引导粒子向更优解收敛。实验结果表明,所提方法在合成超图与真实超图上均优于基线方法。消融实验进一步验证了局部搜索策略与初始化策略的有效性。
图拓扑识别(GTI)是网络化系统中的核心挑战,其底层结构通常不可观测,但节点数据可得。传统方法常依赖概率模型或复杂的优化公式,普遍存在非凸性问题,或需对无环性或正定性等施加严格假设。本文提出一种新颖的协方差匹配(CovMatch)框架,直接将观测数据的经验协方差与由潜在图结构所导出的理论协方差对齐。我们证明:只要数据生成过程允许显式协方差表达式,CovMatch 即可为拓扑推断提供统一路径。我们在线性结构方程模型(SEM)上验证该方法,表明 CovMatch 可自然处理无向图及一般稀疏有向图——无论其是否无环或边权是否为正——且无需显式知晓这些结构性约束。通过适当的重参数化,CovMatch 将图学习问题简化为:对无向图采用锥混合整数规划,对有向图则转化为正交矩阵优化。数值实验表明,即使对于相对大规模图,该方法亦能高效恢复真实拓扑,并在准确性上优于标准基线方法。这些结果凸显 CovMatch 作为 GTI 领域中对数行列式法或贝叶斯方法的一种有力替代方案,为在极简假设下学习复杂网络拓扑开辟了更广阔的研究路径。
现实世界网络通常表现出强烈的传递性,具有非平凡的局部聚类谱和度相关性。这些特征在可处理的网络模型中难以建模,阻碍了对这类复杂网络结构的理论理解。本文通过一种强聚类随机图模型解决该问题,其中随机骨架中的每个三元组以一定概率被闭合。尽管所得图的局部结构具有复杂的环状特性,我们仍给出了局部聚类谱和度相关性的精确表达式,填补了该随机图模型理论描述的空白。特别地,我们发现高传递性伴随正度相关性,且聚类谱呈现非平凡结构。精确的渐近解析结果得到了大规模数值模拟对有限尺寸效应的详尽表征的补充。
我们提出一种有向空间网络模型。该模型以基于年龄的优先连接模型为基础,其中所有弧均从年轻顶点指向年老顶点,并引入概率依赖于两端顶点年龄差的\emph{互逆}连接。该模型生成具有互逆相关性的有向图,具备幂律入度分布和可调的出度分布。我们研究了该模型的两种版本:一种嵌入在$\mathbb{R}^d$中的无限版本,可构造为具有非对称核的权重依赖随机连接模型;另一种是在单位环面上随时间增长的图序列,其局部收敛于无限模型。除了建立两个模型之间的局部极限关系外,我们还研究了度分布、多种有向聚类度量以及有向渗流现象。
链路预测对于揭示社交网络演化规律、节点间关系,以及理解复杂网络的典型机制具有核心意义。目前,针对融合时间演化、关系极性与边权重信息的复杂动态网络的链路预测研究仍显著不足,难以满足实际应用需求。本文面向动态符号加权网络,提出一种三重联合预测框架,以统一预测链路存在性、关系符号与边权重。首先,将动态网络分解为时序快照,并通过符号感知的加权随机游走生成节点语义嵌入;其次,设计多跳结构平衡特征与时序差异特征,分别刻画网络的结构性特征与动态演化规律;模型采用双通道特征解耦机制:节点语义嵌入用于链路存在性预测,而关系符号特征则输入Transformer编码器以建模时序依赖;最终,通过多任务单元协同输出预测结果。仿真实验表明,相较于基线方法,所提框架在链路存在性与关系符号预测性能上平均提升2%–4%,边权重预测误差显著降低40%–50%。
格兰杰因果关系(Granger causality, GC)是一种广泛使用的统计方法,用于推断复杂网络所测时间序列之间的定向影响;但其对高阶(非成对)相互作用敏感,而此类相互作用从根本上塑造了网络的集体动力学。本研究提出格兰杰因果关系的部分分解(Partial Decomposition of Granger Causality, PDGC),一种用于揭示生理网络子系统间信息流模式中冗余性与协同性因果相互作用的工具。该工具基于部分信息分解(partial information decomposition)框架,将从一组驱动随机过程到目标过程的多元GC分解为三类成分:仅由各驱动变量单独携带的独特效应、由多个驱动变量以相同方式携带的冗余效应,以及由若干驱动变量共同携带但任一驱动变量单独均不携带的协同效应。计算基于频域扩展的多元状态空间模型,从而可在特定生理相关频段及全频段积分后的时域中评估PDGC。谱PDGC在易发生神经介导性晕厥患者的生理网络中进行了验证,所用数据包括动脉压、心周期、呼吸及脑血流速度的变异性序列,并与健康对照组比较。该应用揭示了前所未有的生理相互作用模式,这些模式与低频心血管及脑血管振荡的交感神经调控相关,表征了自主神经功能障碍的独特模式。从谱GC中提取高阶因果模式,有助于在众多以数据驱动的网络科学应用中解析振荡过程间多元相互作用背后的因果影响机制。
近期,置换熵及其衍生方法向图信号的拓展为分析在复杂网络上演化的高维复杂系统开辟了新方向。然而,这些度量均根植于香农熵与符号动力学。本文首次探索并验证了经典基于条件熵的度量——样本熵(Sample Entropy, SampEn)是否可被有效定义于图信号之上,并用于刻画复杂网络中数据的非线性动力学特性。我们提出图信号样本熵(SampEnG),该框架通过基于多跳邻域的拓扑感知嵌入,在连续嵌入状态空间中计算有限尺度的相关和,从而将经典样本熵从一维与二维信号(包括时间序列与图像)统一推广至图信号。在合成数据集及真实世界数据集(包括气象站、无线传感器监测与交通系统)上的实验表明,SampEnG 能够复现路径与网格结构上已知的非线性动力学特征。在交通流分析中,针对有向拓扑(编码因果流约束)所计算的 SampEnG 对自由流与拥堵之间的相变尤为敏感,所提供的信息可补充现有基于香农熵的方法。我们预期 SampEnG 将为图信号分析提供新途径,将样本熵及条件熵的概念推广至各类网络数据的非线性分析中。
门控循环神经网络(Gated RNNs)因其高精度而广泛应用于非线性系统辨识,尽管其常表现出复杂且难以分析的混沌动态。本文研究了无混沌网络(CFN)的系统理论特性,该架构最初提出旨在消除标准门控RNN中的混沌行为。首先,我们形式化证明了CFN在设计上满足输入-状态稳定性(ISS)。然而,我们表明确保增量输入-状态稳定性(delta-ISS)仍需对CFN架构施加特定参数约束。为此,我们提出了解耦门网络(DGN),一种CFN的新结构变体,通过在门控机制中移除内部状态连接来实现改进。最后,我们证明DGN无条件满足delta-ISS性质,为非线性动力系统辨识提供了一个增量稳定架构,无需复杂的网络训练调整。数值结果证实,DGN在保持标准架构建模能力的同时,严格遵循这些严格的稳定性保证。
我们提出了一种新颖的建模框架,用于描述随时间演化的网络,能够捕捉网络特征在连续时间中更新时的长期依赖性。动态网络增长通过带标记点过程的条件强度进行函数参数化。这一表征使得能够灵活地联合建模更新时机及网络更新本身,且二者均依赖于完整的左连续样本路径。我们提出了一种路径相关的非线性带标记霍克斯过程作为建模此类数据的表达性强的平台;其动态标记空间嵌入了随时间演化的网络。我们证明了该模型的适定性,并建立了充分的稳定性条件,通过数值研究展示了模拟方法以及后续可行的基于似然的推断,最后通过一个会议参会者社交网络数据的应用实例说明了该方法的有效性。所提出的公式为连续时间复杂网络演化提供了灵活且有理论基础的统计推断框架。
超图通过允许单条边连接多个顶点,推广了经典图结构,为建模高阶交互提供了自然的语言。超超图(Superhypergraph)进一步拓展该范式,支持嵌套的、集合值的实体与关系,从而能够表征普通图或超图所无法表达的层次化、多层级结构。与此同时,神经网络——尤其是图神经网络(GNN)——已成为学习关系型数据的标准工具;近年来,超图神经网络(HGNN)及其理论性质亦取得快速发展。为刻画复杂网络中的不确定性与多维属性,若干分级或多值图框架已被提出,包括模糊图(fuzzy graph)与中智图(neutrosophic graph)。多源图(plithogenic graph)框架则通过整合多值属性、隶属度机制与矛盾机制,对上述方法进行了统一与精化,为异质性及部分不一致信息提供了灵活的表征能力。本书构建了超超图神经网络(SHGNN)与多源图神经网络的理论基础,旨在将消息传递原理扩展至这些先进的高阶结构。我们给出严格的形式化定义,确立基本的结构性质,并证明关键构造的良定性(well-definedness)结果,尤其着重于软图神经网络(Soft GNN)与粗糙图神经网络(Rough GNN)的强化形式化表述。
《计算机、环境与城市系统》;第70卷;第163-174页;2018年发表;出版商:Elsevier
我们在存在干扰的观测性设置下,研究从单个网络中估计平均处理效应(ATE)。弱跨单元依赖性通过一个内生的同伴效应(即网络自回归)项建模,该效应引发随网络距离衰减的依赖性,从而将常见的有限阶干扰条件放宽至无限阶干扰。我们提出一种目标最小损失估计(TMLE)程序,以消除初始估计量的插件偏差。在目标化步骤中,所生成的调整方向融入了网络自回归结构,并为各单元分配异质的、依赖于网络结构的权重。我们发现,与协变量 $\mathbf{X}_i$ 相关的渐近主导项可表示为一个 $V$-统计量,其阶数随网络度数发散。为此类复杂网络依赖场景,我们发展了一种新颖的极限理论,以建立渐近正态性。当 $\mathbf{X}_i$ 独立同分布生成且使用经验分布进行估计时,我们证明所提方法可实现比现有方法更小的渐近方差,并为方差估计提供了理论保证。本文通过大量数值模拟及一场直播数据实证分析,展示了所提方法的优势。
学术界与产业界呈现出相互塑造与动态反馈的机制。尽管二者具有不同的制度逻辑,但在合作发表与人才流动方面已高度适应,体现出制度差异性与深度协作之间的张力。现有对二者知识邻近性的研究主要依赖于合作论文或专利数量等宏观指标,缺乏对文献中知识单元的分析,导致对学术界与产业界之间细粒度知识邻近性的理解不足,可能削弱协作框架设计与资源配置效率。为弥补这一局限,本研究通过细粒度实体与语义空间量化 academia-industry 共同演化轨迹。在实体测量部分,我们利用预训练模型提取细粒度知识实体,采用余弦相似度衡量序列重叠,并通过复杂网络分析考察拓扑特征;在语义层面,我们采用无监督对比学习,通过测度跨机构文本相似性来量化语义空间中的收敛程度;最后,利用引文分布模式检验双向知识流动与相似性之间的相关性。分析表明,学术界与产业界的知识邻近性呈上升趋势,尤其在技术变革之后更为显著,为共演化过程中的双向适应提供了文本证据;此外,在技术范式转变期间,学术界的知识主导地位趋于减弱。本文所用数据集与代码可于 https://github.com/tinierZhao/Academic-Industrial-associations 获取。
集体同步通常由复数序参量 $R e^{iΨ}$ 概括,隐含地将全局相位 $Ψ$ 视为有意义的宏观坐标。本文探讨在耦合随时间变化的振子网络中,$Ψ$ 在何种条件下成为\emph{运行上定义良好}的量。我们研究了在具有时变耦合 $K(t)$ 的图结构上带有阻尼(及可选惯性)的相位振子模型,涵盖标准 Kuramoto 动力学作为极限情形,并包含工程应用相关的网络与空间拓扑结构。我们提出一个运行涌现判据:仅当宏观相位可鲁棒估计时,其才真正涌现,该条件通过弱噪声和有限采样下的规范固定相位滞后波动进行量化。这给出了一个由 $NR^2$ 控制的定量阈值,并明确解释了为何在非相干态中即使 $Ψ$ 可形式定义,仍存在病态问题。非自治耦合引入了斜坡时间尺度,与弛豫时间竞争。基于接近相干态的拉普拉斯模态约化,我们推导出一个图谱速率判据:当 $K(t)λ_2$ 主导斜坡速率时,有序性可跟踪调控协议;而更快的斜坡则导致冻结。数值上,我们通过基于能量的跟踪诊断提取了运行冻结时间,并发现对于非空间网络,冻结后的残余非相干性在以谱协议参数 $λ_2τ$ 为横坐标的图上呈现坍缩现象,适用于 Erdős--Rényi 和小世界图族。最后,在周期晶格上,我们表明拓扑区域与缺陷介导的有序性阻碍完全对齐,导致依赖于协议的长寿命部分同步态,以及系统性偏离谱坍缩。
双曲几何因其能在低维嵌入中有效刻画网络的层次化结构与异质连通模式,已成为表征复杂网络的一种高效潜在空间。近年来,大量双曲图表示学习方法相继被提出。然而,其实用化部署与系统性比较仍面临挑战:现有实现分散、缺乏支持可复现且公平评估的通用工具。本文提出一个开源的双曲图表示学习统一框架,将若干广泛使用的嵌入方法集成于统一的优化接口之下。该新颖框架支持双曲嵌入的一致化训练、可视化与评估,并可无缝对接标准网络分析工具。依托这一统一设置,我们在真实世界网络上对双曲嵌入方法开展了实验研究,聚焦于两类典型下游任务:链路预测与节点分类。除预测精度外,本研究还提供了关于现有方法优势与局限性的实践性洞见,从而助力研究者进行方法的合理选择,并推动双曲图表示学习领域的可复现研究。