全局检索与知识浏览
跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页,做语义追问和来源核验。
通过视觉数据理解城市社会经济状况,是可持续城市发展与政策规划中一项具有挑战性但至关重要的任务。本文提出 \textit{CityLens},一个用于评估大型视觉-语言模型(LVLM)从卫星影像与街景图像中预测社会经济指标能力的综合性基准。我们构建了一个覆盖全球17个城市的多模态数据集,涵盖经济、教育、犯罪、交通、健康与环境六大关键领域,全面反映城市生活的多维特性。基于该数据集,我们定义了11项预测任务,并采用三种评估范式:直接指标预测、归一化指标估计与基于特征的回归。我们在这些任务上对17种前沿LVLM进行了基准测试。CityLens目前是地理覆盖范围最广、指标多样性最高、所评测模型规模最大的城市社会经济基准。实验结果表明,尽管LVLM展现出良好的感知与推理能力,其在预测城市社会经济指标方面仍存在明显局限。CityLens为诊断此类局限提供了统一框架,并为未来利用LVLM理解与预测城市社会经济模式的研究提供指导。代码与数据开源地址为:https://github.com/tsinghua-fib-lab/CityLens。
本文基于印度各行政区(县)与城市的人口规模,对其经济收入(国内生产总值,GDP)开展标度律分析,以探究二者间的依赖关系。标度律分析为识别社会经济组织中的网络效应提供了一种直接方法,而此类效应正是城市与城市化的典型特征。对于印度这一国家层面以下的区域性行政单元——县,我们发现其GDP与人口规模之间近乎呈线性标度关系,该结果显著区别于其他国家城市功能单元中常见的标度模式。通过分析偏离标度律的程度,我们进一步考察了这些区域单元的行为,发现其经济行为存在显著且清晰的地理分布格局。我们对这些格局进行了详细刻画,并将其与关于印度这类多元次大陆国家区域经济发展的既有文献相联系。鉴于印度都市集聚区(Urban Agglomerations)经济数据严重匮乏,我们基于一系列假设,构建了一套以县为单位、面向大型城市的GDP新数据集。该数据集揭示出城市收入与城市规模之间呈现理论预期的超线性标度关系,同时亦展现出与县级经济表现相似的底层经济地理格局。然而,由于缺乏更高精度、直接面向城市层级的经济数据,本研究对印度城市经济表现的分析受到严重制约。我们强调亟需建立印度城市经济规模及其变动的标准化、一致性估算体系,并指出若干可供探索的代理指标。
移动通信网络产生的通话详单记录(CDR)被广泛用于人类移动性研究,但单一移动运营商提供的CDR数据本质上存在偏差,因为其用户群体无法准确反映总体人口分布。基于智利一家主要运营商在圣地亚哥市的数据,我们发现其用户基础在社会经济地位上存在明显偏斜,导致半径回转率(radius of gyration)等聚合指标因实际观测人群的构成而失真。为校正此类抽样偏差,我们应用了多层次回归与事后分层法(MRP)——该方法目前尚未成为基于CDR的移动性研究中的标准做法。我们构建了一个贝叶斯多层次模型,以个体移动性为因变量,以社会经济地位、性别和地理区位为协变量,并在市级行政区(comuna)层面实施部分池化(partial pooling);随后将模型预测结果按人口普查的人口统计结构进行事后分层。该方法使基于CDR的平均半径回转率原始估计值降低了约17%。值得注意的是,仅使用地理信息的简化版模型仍能捕捉大部分偏差,表明只要社会经济群体在空间上存在分布规律,即使用户的社会经济构成未被完全掌握,MRP依然具有实用价值。本例展示了MRP如何为非代表性CDR衍生移动性估计提供一种有原则的校正方法,而非将运营商样本简单视作随机总体样本。
据我们所知,CityLens 是目前城市社会经济感知领域规模最大的基准数据集,其规模体现在地理覆盖范围、指标多样性及模型尺度三方面。该数据集涵盖六大洲共 17 座城市,涉及 6 个社会经济领域中的 11 项指标,并同时采用街景图像与卫星影像。
出版日期:2026年4月30日在线发布;来源:《可持续城市与社会》;作者:孙东颖、陈凌妮、法蒂玛·扎赫拉·赫拉齐
出版日期:2026年7月;来源:《交通研究A辑:政策与实践》(Transportation Research Part A: Policy and Practice),第209卷;作者:Evangelia Maria Thoma、Xin Zhao
发表日期:2026年7月;来源:《Landscape and Urban Planning》,第271卷;作者:Jiawei Gu、Yujia Bao、Yongxuan Li、Shenghao Yuan、Hudson Mumbole、Amanda I. Adler、Aimin Yang、Jinjun Ran
本文旨在探讨地理学如何有助于理解21世纪的国际移民现象。为此,引言部分阐述了核心观点及文本的内在结构;第二部分介绍了指导本研究的理论与方法论框架;第三部分基于二手数据与实证信息,通过文字描述与统计地图呈现研究结果;最后,在结语部分对全文进行总结,以期为所提出的学术讨论提供助益。
信息技术与定位技术的快速发展不仅推动了海量地理空间大数据的持续增长,也引发了对利用此类数据补充遥感影像的关注。已有诸多研究致力于利用地理空间大数据识别人类活动模式,并结合遥感影像开展城市与环境研究。然而,地理空间大数据的代表性与局部性问题,以及融合方法等仍需进一步探索。本文首先回顾了由地理空间大数据驱动的数据挖掘与分析技术的创新进展及其在遥感应用中的发展。此外,简要介绍了“社会感知”与“城市计算”两个流行概念。随后,重点阐述了地理空间大数据在挖掘人类活动动态与社会经济特征方面的作用,以及其与遥感数据结合用于各类研究的可行性。最后,通过若干实证案例,展示了遥感与地理空间大数据在土地利用提取、环境与灾害监测、社会经济动态感知等方面的融合应用。所提供的案例与讨论表明,遥感与地理空间大数据的集成具有高效性与互补性,可从多维度和多尺度支持决策制定。
地理加权回归(GWR)是空间数据分析中用于探究回归关系空间非平稳性的经典统计方法。本文探讨了GWR的一种贝叶斯实现路径,全面讨论了基于尖峰-平板先验(spike-and-slab prior)的贝叶斯变量选择、基于范围先验(range prior)的带宽选择,以及采用修正偏差信息准则(modified deviance information criterion)和修正伪边际似然对数(modified logarithm of pseudo-marginal likelihood)进行模型评估的方法。本文还引入了图距离(graph distance)在面域数据建模中的应用。通过大量模拟研究,我们在小样本与大样本位置数量两种情景下检验了所提方法的经验表现,并与经典频率学派GWR进行了比较。结果表明,所提方法在不同情形下的变量选择与参数估计性能均令人满意。最后,我们将该方法应用于中国30个省份的省级宏观经济数据实证分析;估计与变量选择结果揭示了关于中国经济的若干合理洞见,且与既有研究及事实相符。
夏威夷的气候灾害在发生频率与严重程度上均呈上升趋势,对脆弱社区的影响各异。本文介绍了社区人口普查与空间可视化指数(Community Census and Spatial Visualization Index, CCSVI),这是一个基于网络的地理空间可视化平台,整合了气候灾害数据、社会经济数据及基础设施数据。该系统通过交互式地图与分层数据可视化,支持用户探究环境风险与社会脆弱性之间的关联。社会脆弱性数据与气候灾害数据通常分别采集,导致二者彼此割裂,难以直接整合分析;由于原始数据之间缺乏关联,进行直接比对与融合尤为困难,致使许多非专业用户难以理解数据。此外,现有诸多工具仅聚焦于其中一类数据,限制了其交互能力,亦未能带来实质性改进。CCSVI旨在弥补夏威夷州范围内缺乏可及、统一且交互式系统以分析气候灾害与社会脆弱性关系的不足,从而协助决策者、研究人员及社区成员识别高风险人群、提升防灾备灾能力,并制定基于证据的气候适应策略。
理解与解释复杂的地理现象——从气候变化到社会经济不平等——是地理学及更广泛科学界的核心关注点。已有多种方法用于阐明变量间的关系,从线性回归模型中的系数估计到可解释人工智能(XAI)技术中日益主导的特征归因得分。然而,XAI方法生成的解释通常带有不确定性,这种不确定性源于模型本身及其训练数据。尽管考虑此类不确定性至关重要,但在地理空间领域这一问题仍被普遍忽视。在本研究中,我们基于置信预测开发了一种XAI解释的不确定性量化框架,称为地学解释置信预测(GeoXCP)。通过将空间依赖性纳入建模过程,GeoXCP生成了具有校准不确定性估计的空间自适应解释。我们通过大量模拟实验和真实世界数据集验证了GeoXCP的有效性。结果表明,GeoXCP在多种地理空间场景下均能提供可靠解释,并有效量化不确定性。我们的方法在可解释地理空间机器学习领域实现了重要进展,使决策者能够更好地评估模型驱动洞察的可信度。所提出的框架已实现为名为GeoXCP的Python工具包。
自1913年亨利·福特(Henry Ford)引入移动装配线以来,制造业的基本拓扑结构尚未经历范式层面的变革。过去一个世纪的每一项重大创新——从丰田生产方式(Toyota Production System)到工业4.0(Industry 4.0)——均在福特主义范式内进行优化,而未改变其结构性逻辑:即依托劳动力集聚区布局的、规模化生产的中心化巨型工厂。我们认为,具身智能(embodied intelligence)即将打破这一持续百年的停滞状态;其作用并非提升现有工厂的效率,而是直接触发制造业经济地理本身的相变。当具身人工智能在灵巧性(dexterity)、泛化能力(generalization)、可靠性(reliability)及触觉-视觉融合(tactile-vision fusion)等能力维度跨越关键阈值时,其影响远超成本降低范畴:它将重构工厂选址逻辑、重塑供应链组织方式,并重新定义可行的生产规模。我们通过定义能力空间 C = (d, g, r, t),并证明当能力向量穿越临界曲面时,厂址选择目标函数发生拓扑重构,从而形式化该机制。经由三种路径——权重倒置(weight inversion)、批量坍缩(batch collapse)与人-基础设施解耦(human-infrastructure decoupling)——我们表明,具身智能可支持需求邻近型微型制造(demand-proximal micro-manufacturing),消除“制造荒漠”(manufacturing deserts),并逆转由劳动力套利驱动的地理集聚趋势。我们进一步提出“机器气候优势”(Machine Climate Advantage)概念:一旦人类工人被移除,最优工厂选址将由机器最优运行条件(低湿度、高辐照度、热稳定性)决定,这些因素与传统选址逻辑正交,由此催生一种前所未有的生产地理格局。本文确立了‘具身智能经济学’(Embodied Intelligence Economics)——即研究物理人工智能能力阈值如何塑造经济系统结构的学科。
食品市场可达性是食物系统中一个关键但尚未充分研究的维度,尤其在中低收入国家。本文基于OpenStreetMap与世界粮食计划署(WFP)的开放地理空间数据,对非洲大陆范围内的空间食品市场可达性开展评估。我们比较了三种互补性指标:到达最近市场的通勤时间、30分钟阈值内市场可及性,以及基于熵的空间分布度量,以量化不同环境下的可达性。分析揭示出显著差异:农村地区及经济弱势群体面临更长的通勤时间、更有限的市场覆盖范围,以及更低的空间冗余度。这些可达性模式与相对财富指数(Relative Wealth Index)所衡量的社会经济分层高度一致,并与综合粮食安全阶段分类(Integrated Food Security Phase Classification)评估的粮食不安全水平呈中等程度相关。我们发现可达性存在显著差异:农村及经济弱势群体通勤时间明显更长、市场可及性更低,部分区域通勤时间长达数小时。总体而言,结果表明食品市场可达性反映了更广泛的空间与经济不平等,并在塑造粮食安全结果中发挥重要作用。该框架提供了一种可扩展、数据驱动的方法,可用于识别服务不足区域,并支持非洲多样化背景下公平的基础设施规划与政策制定。
通过融合多模态数据可以更准确地绘制城市土地利用格局。然而,许多研究仅考虑地块内的社会经济与物理属性,忽略了多模态数据带来的空间交互作用及不确定性。为解决上述问题,我们构建了一种多模态数据融合模型(MDFNet),从多模态数据中提取自然物理、社会经济及空间连通性辅助信息。同时,建立基于广义加性模型与可学习权重模块的不确定性分析框架,以解释数据驱动的不确定性。选取深圳作为示范区域,实验结果表明该方法具有有效性,测试准确率达到0.882,Kappa系数为0.858。不确定性分析显示,遥感数据、社会感知数据和出租车轨迹数据对整体任务的贡献率分别为0.361、0.308和0.232。研究还揭示了多模态数据在不同土地利用类别中的协同机制,为城市分布格局的精准、可解释制图提供了有效方法。
尽管基于影像或GIS的客观街道指标已成为城市分析的标准工具,但其仍难以捕捉包容性城市设计所必需的主观感知。本研究提出一种新型多模态街道评估框架(MSEF),将视觉Transformer(VisualGLM-6B)与大语言模型(GPT-4)相融合,实现对街道景观的可解释双输出评估。该框架利用中国哈尔滨逾15,000张标注街景图像,采用LoRA与P-Tuning v2方法进行参数高效微调。模型在客观特征识别任务中达到0.84的F1分数,在居民主观感知一致性检验中达成89.3%的吻合率,并在分层社会经济地理区域中完成验证。除分类准确率外,MSEF还能揭示情境依赖的矛盾现象:例如,非正规商业活动虽提升感知活力,却同时降低行人舒适度;亦能识别非线性及语义依赖模式——如建筑透明度在居住区与商业区引发截然不同的感知效应,从而暴露普适性空间启发法的局限性。通过基于注意力机制生成自然语言推理依据,该框架弥合了感官数据与社会情感推断之间的鸿沟,支持符合联合国可持续发展目标SDG 11的透明化城市诊断。本研究既为城市感知建模提供了方法论创新,也为亟需协调基础设施精度与真实生活体验的规划系统提供了实践价值。
由河流、池塘、湖泊及其他水体构成的城市淡水生态系统,对城市居民具有重要的社会经济与生态价值。然而,关于个体如何与湖泊互动的研究仍十分有限,尤其在城市尺度及精细时空分辨率下尤为不足。为弥补这一空白,我们提出一种数据驱动的分析框架,全面感知人湖交互,并刻画城市内部各湖泊的社会人口学特征。“Lakeplace”一词被提出,用以描述包含湖泊及其中人类活动的场所。对于每个湖泊,其lakeplace的地理边界定义为一级行政区划单元,反映湖泊社会经济邻近尺度。利用大规模个体移动定位数据,我们在美国明尼苏达州双城大都市区(TCMA)的2036个主要湖泊及其互动人群上开展了lakeplace感知分析。各lakeplace的受欢迎程度以其时序访问量衡量,并进一步划分为“湖上”与“湖周”两类人类活动。针对高人气lakeplace,我们探究其吸引力主要源于湖泊本体,抑或源于周边社会人口环境。该lakeplace感知框架为刻画人类活动的时空特征、理解人湖系统相关社会人口知识提供了实用方法。本研究通过地理空间大数据实现人类—环境交互的社会感知,为人本导向的可持续城市规划与城市水资源管理提供启示。
《GIS学报》(Transactions in GIS),2026年4月,第30卷第2期。
城市土地利用信息在城市管理、政府政策制定及人口活动监测中具有重要作用。然而,由于城市系统的复杂性,准确划分城市功能区仍具挑战性。许多研究聚焦于仅基于高空间分辨率(HSR)遥感影像或社交媒体数据提取特征来进行城市土地利用分类,但因缺乏可用模型,极少有研究同时考虑两类特征。本文提出一种新型场景分类框架,通过融合概率主题模型与支持向量机,识别交通分析区层级下的主导城市土地利用类型。该框架内构建了土地利用词汇表,融合了来自HSR影像的自然-物理特征以及多源社交媒体数据的社会经济语义特征。除与人工解译数据对比外,我们设计了多项实验,测试不同语义特征组合下所提模型的土地利用分类精度。分类结果(总体精度=0.865,Kappa=0.828)表明,将多源地理空间数据提取的特征作为语义特征用于训练分类模型具有显著有效性。该方法可为城市规划者分析精细城市结构及监测土地利用变化提供支持,未来将进一步融合多源数据以完善该框架。
贫困是一种复杂的动态挑战,难以通过预设的常微分方程充分刻画。当前,人工智能机器学习(ML)方法在建模真实世界动力系统方面已展现出显著潜力。其中,神经常微分方程(Neural ODEs)作为一种数据驱动方法,能够直接从观测数据中学习连续时间动力学,因而日益成为一种强大工具。本章将Neural ODE框架应用于印度奥里萨邦(Odisha)的贫困动态分析。具体而言,我们利用2007至2020年间关于经济发展与减贫关键指标的时间序列数据。在Neural ODE架构中,系统的时序梯度由一个多层感知机(MLP)表示;所得神经动力系统通过数值常微分方程(ODE)求解器进行积分,以获得状态变量随时间演化的轨迹。在反向传播过程中,采用伴随敏感性方法(adjoint sensitivity method)计算梯度,从而实现对ODE求解器的有效梯度回传。训练完成的Neural ODE模型能以高精度复现观测数据,表明其具备准确刻画混凝土结构住房家庭贫困指标动态演化的能力。结果表明,Neural ODE等机器学习方法可作为建模社会经济转型的有效工具,为政策制定者提供可靠的预测支持,助力更科学、更有效的减贫决策。