全局检索与知识浏览
跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页,做语义追问和来源核验。
随着城市化与气候变化加剧,城市的脆弱性日益上升,因而亟需在极端事件(如极端天气)期间准确预测人类移动性,以支撑基于位置的早期灾害预警、救援资源预部署等下游任务。然而,现有移动性预测模型主要面向常规场景设计,在极端场景下因人类移动模式发生偏移而难以适应。为解决该问题,我们提出\textbf{X-MLM}——一种面向极端场景的跨极端事件移动性语言模型框架,该框架可嵌入现有深度移动性预测方法中:利用大语言模型(LLM)建模移动意图,并在不同城市间迁移各类极端事件对移动意图影响的共性知识。该框架采用检索增强型意图预测器(RAG-Enhanced Intention Predictor)预测下一意图,再通过基于LLM的意图精炼器(Intention Refiner)对其进行优化,最后由意图调制的位置预测器(Intention-Modulated Location Predictor)将意图映射至具体位置。大量实验表明,X-MLM在Acc@1指标上较基线方法提升32.8%,在预测非移动性(immobility)的F1分数上提升35.0%。代码开源地址:https://github.com/tsinghua-fib-lab/XMLM。
预测个体在不同地点之间的移动性在交通科学、空间经济学、社会学及诸多其他领域具有实际应用价值。一百多年来,研究者提出了多种人类移动性预测模型,其中类比于牛顿万有引力定律的引力模型被广泛应用。另一经典模型为介在机会(Intervening Opportunity, IO)模型,该模型指出个体对目的地的选择既取决于目的地本身所提供的机会,也取决于起始地与目的地之间存在的介在机会。基于个体选择行为视角构建的IO模型,近年来催生了大量新型IO类模型。尽管这些IO类模型可在特定时空尺度上实现高精度预测,但尚缺乏一种能够刻画个体在不同时空尺度下目的地选择行为的普适IO类模型。本文提出一种普适的机会模型,该模型纳入两种人类行为倾向:探索倾向与谨慎倾向。本模型为IO类模型建立了新框架,且涵盖经典辐射模型(radiation model)与机会优先选择模型(opportunity priority selection model)。此外,我们利用多种移动性数据验证了该模型的预测能力。结果表明,相较于既有IO类模型,本模型可更准确地预测人类移动性;同时,该模型有助于深入理解不同类型人类移动中个体目的地选择行为的内在机制。
理解极端降雨事件中人类移动的韧性对于提升灾害应对能力与城市韧性至关重要。然而,现有研究大多忽视了韧性模式在不同尺度上的复杂性,未能揭示空间异常现象及其潜在成因。为弥补这一空白,本文提出一种基于大规模个体轨迹数据的框架,以解析多尺度下人类移动的韧性模式。通过动态网络模型量化人类移动流量,并利用韧性曲线分析都市圈与区域尺度下的韧性特征。本研究聚焦于台风玛娃引发的极端降雨事件,覆盖日本的大阪与名古屋地区。研究发现,尽管人类活动显著减少,但移动网络结构保持相对稳定。基于流入与流出量的象限分布分析,人类移动中异常与正常韧性模式的比例约为3:2,且该比例在两个尺度上均保持一致。有趣的是,异常韧性模式与建成环境的局部地理特征密切相关,呈现出收入、性别与年龄层面的差异。这些发现对政策制定者优化灾后恢复策略及指导未来城市基础设施建设以增强韧性具有重要价值。
人类移动性研究已在多个方面取得显著进展,但由于难以获取家庭层面数据,对长期、长距离迁移行为的深入而广泛的研究仍显不足。本文利用简历数据探究大尺度空间下的人类迁移行为。研究发现,城市间吸引力差异导致人口流动结构呈现不对称性,反映出人口竞争的影响;该流动结构可近似由空间经济学中的引力模型描述。此外,引力模型中距离函数的标度指数值小于短期出行行为对应的值,表明相较于短期出行行为,长期人类迁移行为对距离的敏感性更低。本文还考察了引力模型中各变量的标度系数,结果表明经济水平是影响迁移的主要因素。
移动通信网络产生的通话详单记录(CDR)被广泛用于人类移动性研究,但单一移动运营商提供的CDR数据本质上存在偏差,因为其用户群体无法准确反映总体人口分布。基于智利一家主要运营商在圣地亚哥市的数据,我们发现其用户基础在社会经济地位上存在明显偏斜,导致半径回转率(radius of gyration)等聚合指标因实际观测人群的构成而失真。为校正此类抽样偏差,我们应用了多层次回归与事后分层法(MRP)——该方法目前尚未成为基于CDR的移动性研究中的标准做法。我们构建了一个贝叶斯多层次模型,以个体移动性为因变量,以社会经济地位、性别和地理区位为协变量,并在市级行政区(comuna)层面实施部分池化(partial pooling);随后将模型预测结果按人口普查的人口统计结构进行事后分层。该方法使基于CDR的平均半径回转率原始估计值降低了约17%。值得注意的是,仅使用地理信息的简化版模型仍能捕捉大部分偏差,表明只要社会经济群体在空间上存在分布规律,即使用户的社会经济构成未被完全掌握,MRP依然具有实用价值。本例展示了MRP如何为非代表性CDR衍生移动性估计提供一种有原则的校正方法,而非将运营商样本简单视作随机总体样本。
精确建模人类移动性对城市规划、流行病学和交通管理至关重要。本文提出马尔可夫型 Reeb 图(Markovian Reeb Graphs),一种新颖框架,将 Reeb 图从描述性分析工具转变为面向时空轨迹的生成模型。该方法捕捉个体与群体层面的生命活动模式(Patterns of Life, PoLs),并生成能保持基础行为特征、同时嵌入随机变异性的逼真轨迹——其核心在于将概率转移嵌入 Reeb 图结构之中。我们提出了两种变体:面向个体智能体的序列型 Reeb 图(Sequential Reeb Graphs, SRGs)与融合个体及群体 PoLs 的混合型 Reeb 图(Hybrid Reeb Graphs, HRGs)。在 Urban Anomalies 和 Geolife 数据集上,我们基于五项移动性统计指标对其进行了评估。结果表明,HRGs 在各项指标上均展现出优异的保真度,且仅需规模适中的轨迹数据集,无需依赖特定辅助信息。本工作确立了马尔可夫型 Reeb 图作为轨迹仿真的一种有前景的框架,具有在各类城市环境中的广泛适用性。
参与式城市感知利用人类移动性实现大规模城市数据采集,但现有方法通常依赖中心化优化,并假设参与者同质化,导致任务分配僵化,忽视个人偏好及城市环境的异质性。我们提出 MAPUS——一种基于大语言模型(LLM)的多智能体框架,用于支持个性化与公平性的参与式城市感知。在该框架中,参与者被建模为具备个体档案与日程安排的自主智能体,而协调智能体则执行兼顾公平性的选择,并通过基于自然语言的协商机制优化感知路径。在真实世界数据集上的实验表明,MAPUS 在保持具有竞争力的感知覆盖率的同时,显著提升了参与者满意度与公平性,从而推动构建更以人为中心、更具可持续性的城市感知系统。
近年来,手机数据被广泛应用于人类移动性分析。识别个体活动地点是手机数据处理的基础步骤。现有方法通常通过聚合多日空间相邻的位置记录来识别活动地点。然而,仅考虑空间关系而忽略时间关系可能导致活动地点识别不准确,并影响活动模式分析。本研究提出一种基于时空知识图谱(STKG)的方法,用于从手机数据中识别活动地点。构建了用于描述个体移动特征的STKG,将个体停留的空间与时间关系推断并转化为时空图。采用模块度优化的社区检测算法识别具有密集时空关系的停留点,将其视为活动地点。以上海市为例进行了案例研究,验证所提方法的性能。结果表明,相较于两种基线方法,基于STKG的方法能够在合理空间范围内,将最长白天停留的活动地点数量减少45%;此外,该方法在不同日期活动起止时间上的方差更低,表现优于两种基线方法约10%至20%。同时,基于STKG的方法能有效区分地理上接近但时间模式不同的地点。这些发现证明了基于STKG的方法在提升空间精度和时间一致性方面的有效性。
人类活动轨迹(HATs)对诸多应用至关重要,包括人类移动性建模与兴趣点(POI)推荐。然而,日益增长的隐私关切严重限制了真实大规模HAT数据集的获取。生成式人工智能的最新进展为此类应用提供了合成高保真且隐私保护型HAT的新机遇。但仍有两大挑战亟待解决:(i)HAT具有高度不规则性与动态性,时间间隔长且变化显著,难以准确刻画其复杂的时空依赖关系及底层分布;(ii)生成模型通常计算开销大,导致长期、细粒度HAT合成效率低下。为应对上述挑战,我们提出SynHAT——一种基于新型时空去噪扩散模型的计算高效、由粗到细HAT合成框架。第一阶段,我们构建Coarse-HADiff,用于建模粗粒度潜在时空轨迹的整体时空依赖关系;该模块引入一种新颖的潜在时空U-Net结构,并配备双分支Drift-Jitter机制,以在去噪过程中联合建模平滑的空间转移与时间变化。第二阶段,我们设计三步流程:行为模式提取、Fine-HADiff(架构与Coarse-HADiff一致)以及语义对齐,以从第一阶段输出中生成细粒度潜在时空轨迹。我们从数据保真度、实用性、隐私性、鲁棒性与可扩展性五个维度对SynHAT进行了全面评估。在来自三个国家四座城市的现实世界HAT数据集上的实验表明,SynHAT显著优于现有最先进基线方法,在空间与时间指标上分别提升52%与33%。
通过2024年巴黎奥运会探索时空分析!基于人类移动性数据发掘洞见,并了解如何利用空间分析工具。
GeoIndustry’24,2024年10月29日至11月1日,美国佐治亚州亚特兰大——例如城市规划与设计。一个相关但独立的时间要素是社会经济周期性:活动模式受一天中的时段、一周中的星期几以及一年中的月份影响。识别并建模此类变化,对理解高峰时段交通、购物趋势及旅游旺季等行为至关重要。
当前关于活动空间的研究受限于绝对物理空间的概念化,未能考虑由人流动态在不同地点间空间互动所重构的关系空间的异质性,且未能充分纳入人类移动的内在层级特性。因此,这些方法无法真实反映人们通过出行与城市空间的互动方式。从关系空间的视角出发,本研究提出新的层级活动区域模型(Hierarchical Activity Region Model, HARM),以推导不同城市群体感知的活动空间及其层级属性。基于纽约市曼哈顿地区出租车数据,我们验证了该模型在桑迪飓风前后不同阶段出行行为中的增强有效性。实证结果表明,即使在重大天气事件干扰下,城市内部出行仍保持清晰的层级组织结构;然而,出行呈现出层级压缩效应,表现为层级数量减少、特征尺度扩大,随后出现反弹。对推导出的层级结构进行聚类分析揭示了显著的异质性,源于人口特征差异:部分群体维持更深层次结构或快速恢复,而另一些群体则经历层级持续丧失。本研究为理解城市移动的功能层级提供了重要洞见,有助于推动更具可持续性、韧性与公平性的城市规划。所提出的范式具有普适性,适用于更广泛情境下的人类移动研究。
人类移动生成旨在合成合理的轨迹数据,广泛应用于城市系统研究。尽管基于大语言模型的方法在生成日常轨迹方面表现优异,但在大规模社会事件期间的偏离性移动捕捉方面仍存在困难。这一局限源于两个关键缺口:(1)缺乏用于设计与评估的事件标注移动数据集;(2)现有框架在生成轨迹决策时,无法协调用户习惯模式与事件强制约束之间的冲突。本文通过双重贡献解决上述问题。首先,我们构建了首个涵盖三大事件(台风海贝思、新冠疫情、2021年东京奥运会)的事件标注移动数据集。其次,我们提出ELLMob,一种基于模糊表征理论的自对齐大语言模型框架,能够首先提取习惯模式与事件约束之间的竞争性理由,并通过迭代对齐生成既符合习惯又响应事件的轨迹。大量实验表明,ELLMob在所有事件中均优于现有最先进基线方法,验证了其有效性。代码与数据集已公开于 https://github.com/deepkashiwa20/ELLMob。
理解游客移动中活动参与的时间与序列特征是出行行为研究的核心,但GPS轨迹存在噪声、采样不规则,且与活动地点的关联较弱,从而限制了其解释性与情景分析能力。为此,我们采用显式的先验-似然加权方法,将每个停留事件以概率方式映射至候选兴趣点(POIs),生成归一化的兼容性分布,而非硬性匹配。基于2021年11月日本箱根地区高密度游客轨迹数据,我们依据观测所得场所类别标签(MID10)构建语义化停留事件序列,并通过按小时-类别的分布剖面、类别间转移关系及期望停留模式刻画移动节奏。在此节奏特征基础上,我们开发了一种节奏一致的半马尔可夫模拟器,可生成具有时间条件化转移与类别依赖型停留行为的合成停留事件序列。在实测数据中,按小时-类别的汇总统计通过对软标签进行概率加权聚合获得;在模拟中,每个事件均以离散类别及采样所得停留时长生成,从而支持聚合后的一致性对比。我们进一步开展反事实POI名录情景分析,量化假设性POI配置变化对不同时段、类别及空间(尤其是枢纽与主干廊道周边)停留强度的影响。观测数据与模拟结果的对比显示,二者在时间分布剖面与类别分布上高度吻合,表明概率化标注与节奏一致模拟既保留了关键移动结构,又为交通地理学情景评估提供了可解释的基础。
统筹规划城镇化布局是新时期国土空间规划政策的重要组成部分。明确不同空间的主要功能并划分城市功能区,对于优化土地开发模式具有重要意义。本文从数据挖掘的角度识别与分析城市功能区,所得结果与实际情况相符。研究以代表性出租车轨迹数据为基础,选取成都绕城高速范围内的滴滴出行轨迹数据,首先生成轨迹时间序列数据,并利用动态时间规整(DTW)算法构建时间序列相似性矩阵;其次,采用K-中心点聚类算法生成土地聚类的初步结果,并选取分类精度较高的样本作为训练样本;随后,基于DTW的K近邻(KNN)分类算法用于城市功能区的分类与识别;最后,结合兴趣点(POI)辅助分析,获得成都市最终的功能布局。结果表明,成都市的空间结构复杂,城市功能相互交织,但仍遵循一定规律。此外,交通流量与人流数据相较于简单的出租车上下车数据更能反映居民出行规律。原始DTW计算方法具有较高的时间复杂度,可通过归一化及降低时间序列维度进行优化。半监督学习分类方法同样适用于轨迹数据,最佳选择应为
移动性基础模型(MFMs)已推动人类移动模式建模的发展,但受限于数据规模与语义理解能力,其性能面临瓶颈。大型语言模型(LLMs)虽具备强大的语义推理能力,却缺乏对时空统计规律的固有理解,难以生成物理上合理的移动轨迹。为弥补上述不足,我们提出MoveFM-R——一种新颖框架,通过引入语言驱动的语义推理能力,充分释放移动性基础模型的潜力。该框架着力解决两大关键挑战:连续地理坐标与离散语言词元之间的词汇不匹配问题,以及MFMs隐空间向量与LLMs语义世界之间的表征鸿沟。MoveFM-R基于三项核心创新:语义增强的位置编码以弥合地理与语言之间的差距;渐进式课程学习机制以对齐LLM推理与移动模式;以及支持条件轨迹生成的交互式自反思机制。大量实验表明,MoveFM-R显著优于现有基于MFMs和LLMs的基线方法;在零样本设定下展现出强泛化能力,并能依据自然语言指令高效生成逼真轨迹。通过融合MFMs的统计建模能力与LLMs的深层语义理解,MoveFM-R开创了一种新范式,实现对人类移动更全面、可解释且更强大的建模。MoveFM-R的实现代码已公开于https://anonymous.4open.science/r/MoveFM-R-CDE7/。
非平衡统计物理中的一个基本问题是:在强驱动系统中,有效平衡行为是否能在粗粒化尺度上出现。本文通过分析涵盖数百万旅行者的五年城际流动数据,研究了这一问题在人类移动背景下的表现。尽管短期流动高度不对称,但经过时间粗粒化后,超过一半的城市对趋于实现有效的流动平衡,归一化的方向不平衡随幂律衰减。其余城市对则表现出持续的漂移主导流或两种极端之间的交叉过渡。一种将移动分解为方向性漂移与关联涨落的随机模型定量捕捉了所有三种模式的共存。直接测量的涨落过程方差标度证实其接近扩散行为,且存在依赖于状态的偏差。这些结果表明,大规模移动网络呈现出从破坏到恢复流动对称性的尺度依赖性转变,对运输与传播动力学建模具有直接意义。
人类移动建模对多种城市应用至关重要。然而,现有数据驱动方法常受限于数据稀缺问题,难以在缺乏或无法获取历史轨迹数据的地区部署。为弥补这一空白,我们提出\textbf{ActivityEditor}——一种面向零样本跨区域轨迹生成的新型双大语言模型(LLM)代理框架。该框架将复杂的轨迹合成任务分解为两个协同阶段:首先,一个基于意图的代理利用人口统计学驱动的先验知识,生成结构化的人类意图与粗粒度活动链,以保障高层级的社会语义一致性;随后,一个编辑代理通过迭代修订,将上述输出精炼为符合人类移动规律的轨迹。该能力通过多奖励强化学习获得,各奖励均基于真实世界中的物理约束,使代理能够内化移动规律,确保生成轨迹的高度保真性。大量实验表明,\textbf{ActivityEditor}在跨多样化城市场景迁移时展现出卓越的零样本性能,同时保持高统计保真度与物理有效性,为数据稀缺场景下的移动模拟提供了鲁棒且高度可泛化的解决方案。代码地址:https://anonymous.4open.science/r/ActivityEditor-066B。
人类移动建模对多种城市应用至关重要。然而,现有数据驱动方法常受限于数据稀缺问题,难以在缺乏或无法获取历史轨迹数据的区域中应用。为弥补这一空白,我们提出\textbf{ActivityEditor}——一种面向零样本跨区域轨迹生成的新型双大语言模型(LLM)代理框架。该框架将复杂的轨迹合成任务分解为两个协同阶段:首先,一个基于意图的代理利用人口统计学驱动的先验知识,生成结构化的人类意图与粗粒度活动链,以保障高层级的社会语义一致性;随后,编辑代理通过迭代修订,将上述输出精炼为符合人类移动规律的轨迹。该能力通过强化学习获得,其奖励函数综合了多个基于真实世界物理约束的指标,使代理能够内化移动规律并确保高保真度的轨迹生成。大量实验表明,\textbf{ActivityEditor}在跨不同城市场景迁移时展现出卓越的零样本性能,同时保持高度的统计保真性与物理有效性,为数据稀缺场景下的移动仿真提供了鲁棒且高度可泛化的解决方案。代码地址:https://anonymous.4open.science/r/ActivityEditor-066B。
我们提出一种人类移动的生成模型,其中轨迹作为在空间交互网络上定义的、随时间变化的马尔可夫动态的实现而产生。该模型构建了包含枢纽、通道、支线路径和地铁连接的分层路由结构,并利用类似引力的距离衰减函数结合外部施加的时间调度与方向性偏差来指定转移矩阵。人口质量以不可区分且无记忆的移动者形式演化,每个时间步仅执行一次转移。在聚合后,生成的轨迹再现了反映网络几何结构、时间调制及连通性约束的有序起止流。通过将Perron-Frobenius定理应用于每日演化算子,我们识别出一个唯一的周期性不变人口分布,作为自然的非瞬态参考状态。我们验证了轨迹层面实现与多步马尔可夫动态之间的一致性,表明差异完全归因于有限种群采样。该框架提供了一种以网络为中心、保护隐私的移动轨迹生成方法,并可在不引入个体行为假设的前提下研究时间流逝下的流动结构。
人类移动行为的精准预测已产生显著的社会经济影响,例如位置推荐与疏散建议。然而,现有方法普遍存在泛化能力不足的问题:单模态方法受限于数据稀疏性与固有偏差,而多模态方法难以有效捕捉由静态多模态表征与时空动态之间的语义鸿沟所导致的移动动态特征。为此,我们引入多模态时空知识以刻画移动动态,用于位置推荐任务,提出\textbf{M}ulti-\textbf{M}odal \textbf{Mob}ility(\textbf{M}$^3$\textbf{ob})模型。首先,通过利用大语言模型增强的时空知识图谱(STKG)所捕获的功能语义与时空知识,构建统一的时空关系图(STRG)以实现多模态表征。其次,设计一种门控机制融合不同模态的时空图表示,并提出一种基于STKG的跨模态对齐方法,将时空动态知识注入静态图像模态。在六个公开数据集上的大量实验表明,所提方法不仅在常规场景下持续提升性能,且在异常场景下展现出显著的泛化能力。