全局检索与知识浏览
跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页,做语义追问和来源核验。
GISclaw——一个面向全栈地理空间分析的开源大语言模型(LLM)驱动智能体系统。本 GitHub 仓库由开发者 geumjin99 维护,最后更新时间为 2026-03-27。🚧 即将发布 🚧 论文录用后,将公开源代码、评估脚本及基准测试结果。
我们对NASA与IBM联合开发的Prithvi-EO-2.0地理空间基础模型在利用卫星影像进行小型沙质岛屿海岸线提取方面的表现进行了初步评估。我们收集并标注了来自马尔代夫两个岛屿的225幅多光谱图像数据集,并公开发布该数据集;同时,我们在包含5至181幅图像的训练子集上对Prithvi模型的300M和600M参数版本进行了微调。实验结果表明,即使仅使用5幅训练图像,模型仍能取得优异性能(F1值为0.94,IoU值为0.79)。研究结果展示了Prithvi模型强大的迁移学习能力,凸显了此类模型在数据匮乏地区支持海岸带监测的巨大潜力。
亟需能够处理各类数据源、其模态以及不同空间与时间分辨率的策略与工具。过去几十年间,深度学习的兴起与计算能力的增长,已彻底改变了遥感(EO)数据的处理方式,其应用涵盖地球系统科学、城市计算、地理空间语义学和遥感等领域。
探讨地理空间基础模型的现状,涵盖表征学习到人口动态等主题,并汇总CARTO与巴塞罗那超级计算中心(BSC)联合举办的研讨会见解。
滑坡对生命、基础设施和环境造成严重破坏,因此准确及时的制图对于灾害预防与应对至关重要。然而,传统深度学习模型在应用于不同传感器、区域或训练数据有限的情况下往往表现不佳。为应对这些挑战,我们提出一个涵盖传感器、标签和领域三个维度的分析框架,用于适应地理空间基础模型(GeoFMs),重点聚焦于Prithvi-EO-2.0在滑坡制图中的应用。通过一系列实验,我们发现该模型在性能上持续优于任务特定的卷积神经网络(U-Net、U-Net++)、视觉Transformer(Segformer、SwinV2-B)以及其他GeoFMs(TerraMind、SatMAE)。该模型基于全球预训练、自监督学习以及可适应的微调机制,在面对光谱变化时表现出鲁棒性,即使在标签数据稀缺条件下仍能保持较高精度,并在多种数据集和地理环境中展现出更可靠的泛化能力。与此同时,我们也指出了仍存在的挑战,如计算成本较高以及可用于滑坡研究的可复用AI就绪训练数据有限。总体而言,本研究将GeoFMs定位为实现更稳健、可扩展的滑坡风险减缓与环境监测方法的重要一步。
在大数据时代,基于云边协同数据的智能教学空间模型构建是当前教育创新探索的重点。在理解构建模型的基础上,依托云边协同数据的安全存储体系,本文深入探讨了该技术的实现路径,并最终获得相关成果。
随着城市化进程和气候变化的推进,城市热岛效应日益频繁且加剧。为制定有效的缓解策略,城市需要详细的气温数据。然而,基于传统机器学习模型和有限数据基础设施的预测分析方法在欠覆盖区域常导致不准确的预测。在此背景下,基于全球非结构化数据训练的地理空间基础模型展现出强大的泛化能力,且仅需极少微调,为传统方法受限的场景提供了替代方案。本研究对地理空间基础模型进行微调,以预测未来气候情景下的城市地表温度,并通过模拟植被策略探讨其对土地覆盖变化的响应。微调后的模型像素级下采样误差低于1.74 °C,且与地面实测模式一致,表现出最高达3.62 °C的外推能力。
地理空间基础模型(GeoFM)有望为地球观测(EO)任务提供广泛的泛化能力,尤其在数据受限条件下表现突出。然而,其庞大的模型规模对资源受限的航天器硬件部署构成挑战。为此,我们提出了一种基于视觉Transformer(ViT)的GeoFM紧凑型变体,在保持下游任务性能的同时实现了机载执行。通过对五个下游任务的评估以及在两种典型飞行环境中的验证,表明模型压缩与领域适应对于降低模型尺寸和资源需求、同时在实际运行条件下维持高性能至关重要。我们进一步展示了在国际空间站搭载的IMAGIN-e有效载荷上实现的可靠在轨推理。这些结果确立了从大型GeoFM到可飞行、资源高效的部署路径,拓展了地球观测任务中机载人工智能的可行性。
基于 Google Agent Developer Kit (ADK) 构建的 AI 驱动地理空间分析平台。v16.0 版本实现 SIGMOD 2026 定义的 L3 级自主智能体能力,涵盖语义算子、多智能体协作、错误恢复、防护机制(guardrails)、遥感分析、工具演化及 AI 技能创建。包含 2966 余项测试用例,完整实现《Agentic Design Patterns》所列全部 21 种设计模式。涉及主题包括 agentic-design-patterns、ai-agent、autonomous-agent、chainlit、data-fusion、deep-reinforcement-learning。本 GitHub 仓库由开发者 zhouning 维护,主要编程语言为 Python,GitHub Star 数为 9,最后更新时间为 2026-04-01。
洪水易发性制图(FSM)对于灾害预防至关重要,但在缺乏数据的地区仍具挑战性,因为水动力模型需要密集的地球物理输入。本文提出ZeroFlood,一种用于数据高效洪水易发性制图的地理空间基础模型框架。该方法通过基于模态思维(TiM)的推理对地理空间基础模型(GFMs)进行微调,实现仅依赖基本地球观测数据(如Sentinel-1或Sentinel-2影像)进行洪水预测。利用数据丰富区域的配对地球观测数据与模拟洪水地图,ZeroFlood通过跨模态表示学习弥合数据差距。基于TerraMind和Prithvi GFMs的实验表明,TiM提升了模型鲁棒性,其中TerraMind-Large配置的F1得分为67.21。结果证明了基于基础模型的FSM在洪水风险管理中具有可扩展性和数据高效性。
基础模型(FMs)是大规模预训练的人工智能(AI)系统,已彻底改变自然语言处理和计算机视觉领域,并正推动地理空间分析与地球观测(EO)的发展。它们有望在各类任务中实现更好的泛化能力、可扩展性以及仅需少量标注数据即可高效适应。然而,尽管地理空间基础模型迅速普及,其在现实世界中的实用性及其与全球可持续发展目标的契合度仍缺乏深入探索。我们提出了SustainFM,一个基于17项可持续发展目标的综合性基准测试框架,涵盖从资产财富预测到环境灾害检测等极其多样的任务。本研究对地理空间基础模型进行了严谨且跨学科的评估,为理解其在实现可持续发展目标中的作用提供了关键洞见。研究发现:(1)尽管并非在所有任务中均表现最优,但基础模型通常在多种任务和数据集上优于传统方法。(2)评估基础模型应超越准确率,纳入可迁移性、泛化能力及能源效率等关键指标,以确保其负责任的应用。(3)基础模型能够提供可扩展的、以可持续发展目标为导向的解决方案,广泛适用于应对复杂的可持续性挑战。至关重要的是,我们倡导从以模型为中心的研发转向以影响为导向的部署模式,并强调能源效率、对领域偏移的鲁棒性以及伦理考量等指标的重要性。
《国际地理信息科学杂志》;第39卷;第12期;页码2862-2885;2025年发表;出版机构Taylor & Francis。
基础模型(FMs)通过大规模预训练在多个领域实现了最先进性能。在地球观测(EO)领域,近年来海量卫星数据档案(拍字节级)的可用性推动了地理空间基础模型(GFMs)的发展。然而,关于数据集规模、模型架构与模型规模如何共同决定下游性能的基本问题仍待解答。本文系统地探索该设计空间,基于三个数据集规模进行模型预训练与微调:PhilEO Globe(0.5TB)、FastTOM(2TB,本文首次提出)以及MajorTOM(23TB)。评估了三种架构族:Geo-Aware U-Net(CNN)、ViT-UPerNet(Transformer)和Mamba(状态空间模型),涵盖参数量从44M到300M的多种模型规模。所有模型均在PhilEO Bench上进行基准测试,任务包括道路密度与建筑密度回归、土地覆盖分割,并与现有GFMs如TerraMind和Prithvi-EO-2.0进行对比。结果表明,在少样本设置下,基于CNN的模型依然具有较强竞争力,其中200M参数的Geo-Aware U-Net在回归任务中优于更大规模的架构。然而,当扩展至拍字节级数据集时,ViT-UPerNet表现最佳,尤其在MajorTOM(23TB)上的语义分割任务中优势显著。最后,我们首次对Mamba模型在地球观测领域的应用进行了广泛评估,凸显其潜在的效率优势,但需进一步的大规模预训练才能完全达到CNN与ViT的性能水平。本文公开发布全部代码、预训练模型及FastTOM数据集,以支持可复现性并促进对GFMs缩放定律的深入研究。
基础模型已深刻变革自然语言处理与计算机视觉领域,其影响正重塑遥感图像分析。凭借强大的泛化能力与迁移学习特性,基础模型天然契合遥感数据的多模态、多分辨率及多时相特征。为应对该领域的独特挑战,多模态地理空间基础模型(GFMs)应运而生,成为专门的研究前沿。本综述从模态驱动视角系统回顾多模态GFMs,涵盖五种核心视觉与视觉-语言模态。我们探讨成像物理差异与数据表征方式如何影响交互设计,并分析对齐、融合与知识迁移的关键技术,以应对模态异质性、分布偏移与语义鸿沟问题。训练范式、模型架构及任务特定适应策略的进展得到系统评估,同时梳理了大量新兴基准。代表性多模态视觉与视觉-语言GFMs在十项下游任务中被评估,深入剖析其架构特点、性能表现与应用场景。涵盖土地覆盖制图、农业监测、灾害响应、气候研究与地理空间情报等真实案例研究,展示了GFMs的实际应用潜力。最后,本文指出领域泛化、可解释性、效率与隐私等关键挑战,并展望未来研究的可行方向。
地球观测(EO)对于监测环境变化、应对灾害以及管理自然资源至关重要。在此背景下,基础模型有助于遥感图像分析,以准确且高效地提取相关地理信息。然而,随着这些模型规模的增大,微调面临日益严峻的计算资源与成本挑战,限制了其可及性与可扩展性。此外,全量微调可能导致预训练特征遗忘,甚至降低模型泛化能力。为解决这一问题,参数高效微调(PEFT)技术提供了一种有前景的解决方案。本文针对多种基础模型架构与PEFT技术,在五个不同的地球观测数据集上进行了广泛实验,评估其有效性。结果提供了全面的对比分析,揭示了PEFT方法在何种情境下以及如何支持预训练地理空间模型的适应。我们证明,PEFT技术在性能上可达到甚至超越全量微调,并提升模型对未见地理区域的泛化能力,同时显著降低训练时间与内存需求。额外实验探讨了架构选择(如解码器类型或元数据使用)的影响,建议采用UNet解码器并避免使用元数据作为最优配置。我们已将所有评估的基础模型与技术集成至开源工具包TerraTorch,以支持快速、可扩展且低成本的模型适配。
随着单一模型能力不断增强,我们发现许多现实世界的问题需要跨领域的综合洞察。回答诸如“飓风可能在何处登陆?哪些社区最易受灾害影响,应如何准备?”等复杂问题,需要对影像、人口和环境信息进行综合推理。Earth AI 将前沿模型与地理空间推理代理相结合,以应对全球重大挑战。
CARTO 现支持直接在地理空间基础模型(geospatial foundation model)的嵌入向量(embeddings)上运行分析。通过可视化、聚类与变化检测,将空间数据转化为决策依据。
本文探讨了如何在 Amazon SageMaker 上部署领先的 GeoFM(Clay Foundation 的 Clay 基础模型,可在 Hugging Face 获取),以实现大规模推理与微调。
自监督学习(SSL)已革新遥感(RS)领域的表征学习,推动地理空间基础模型(GFMs)利用海量未标注卫星影像以支持多样化的下游任务。目前,GFMs主要采用对比学习或掩码图像建模等目标,因其在学习可迁移表征方面表现优异。然而,生成式扩散模型在图像生成过程中展现出捕捉遥感任务所需多粒度语义的潜力,却尚未在判别性应用中得到充分探索。这引发了一个问题:生成式扩散模型是否同样具备卓越性能,并可作为具备足够判别能力的GFMs?本文通过SatDiFuser框架给出回答,该框架将基于扩散的生成式地理空间基础模型转化为强大的判别性遥感预训练工具。通过对多阶段、依赖噪声的扩散特征进行系统分析,我们提出了三种融合策略,以有效利用这些多样化表征。在遥感基准测试上的大量实验表明,SatDiFuser优于当前最先进的GFMs,在语义分割任务中实现最高达+5.7%的mIoU提升,在分类任务中实现+7.9%的F1分数提升,证明了基于扩散的生成式基础模型在判别性能上可与甚至超越传统判别式GFMs。源代码地址:https://github.com/yurujaja/SatDiFuser。
面向地理空间AI智能体(GeoAI)的开源框架,支持任务规划、多工具协同执行、假设验证、动态重新规划以及全流程操作可追溯性。涉及主题包括:ai-agents、django、geoai、geospatial、gis、llm。本GitHub仓库由开发者juaquicar维护,主要编程语言为Python,最后更新时间为2026-03-26。
随着城市化进程和气候变化的推进,都市热岛效应日益频繁且严重。为制定有效的缓解策略,城市需要详细的气温数据,但传统机器学习模型在数据有限的情况下往往产生不准确的预测,尤其是在服务不足的区域。基于全球非结构化数据训练的地理空间基础模型提供了一种有前景的替代方案,其具备强大的泛化能力,仅需少量微调即可应用。本研究通过量化绿地的降温效应并将其与模型预测结果进行对比,建立了都市热模式的经验真实数据,用以评估模型的准确性。随后,对基础模型进行微调,以预测未来气候情景下的地表温度,并通过模拟修复(inpainting)展示了其在缓解支持中的实际价值。结果表明,基础模型为数据匮乏地区评估都市热岛缓解策略提供了有力工具,有助于建设更具气候韧性的城市。
An AI-powered geospatial analysis platform featuring over 35 GIS tools, a Cesium-based 3D globe, and natural language interaction. Users control maps via natural language, and AI automatically performs spatial analysis and visualization. Topics include 3d-globe, ai, cesiumjs, fastapi, geospatial, and gis. This GitHub repository is maintained by gaopengbin (developer). Primary language: Python. GitHub stars: 1. Last updated: 2026-03-24.
地理空间基础模型(GFMs)的研究因在地理空间人工智能(AI)领域中具备实现高泛化能力和领域适应性的潜力,从而显著降低个体研究者的模型训练成本,已成为当前热点。与ChatGPT等大型语言模型不同,构建用于图像分析的视觉基础模型,尤其是在遥感领域,面临诸多挑战,例如如何将多样化的视觉任务统一为通用问题框架。本文评估了近期发布的NASA-IBM GFMs Prithvi在多个基准数据集上的高层图像分析任务预测性能。选择Prithvi的原因在于它是首个基于高分辨率遥感影像时序数据训练的开源地理空间基础模型。通过一系列实验,对比了Prithvi与其他预训练专用任务AI模型在地理空间图像分析中的表现。本文提出并整合了新的策略,包括波段适应、多尺度特征生成以及微调技术,将其融入图像分析流程,以增强Prithvi的领域适应能力并提升模型性能。深入分析揭示了Prithvi的优势与不足,为改进Prithvi及未来地理空间视觉基础模型的开发提供了重要启示。