全局检索与知识浏览
跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页,做语义追问和来源核验。
探讨 GeoAI 的基本原理,即人工智能(AI)与地理信息系统(GIS)相结合,用于分析空间数据、识别空间模式,并提供可操作的地理空间洞察。
本文介绍针对 GeoAI 助理的智能体基础单元(agency primitives)的持续研究——这些是将基础模型(Foundation models)与以人工制品(artifacts)为中心、以人为中心(human-in-the-loop)的工作流相连接的核心能力,而地理信息系统(GIS)从业者实际工作正发生于此类工作流中。尽管卫星影像字幕生成、视觉问答及可提示分割等技术已取得进展,但这些能力尚未为从业者带来实际生产力提升;后者大部分时间用于生成矢量图层、栅格地图和制图成果。这一差距不仅源于模型能力本身,更在于缺乏一个支持迭代协作的智能体层(agency layer)。我们为此类智能体层提出一套包含 9 个基础单元的术语体系,涵盖导航(navigation)、感知(perception)、地理参考记忆(geo-referenced memory)与双重建模(dual modeling)等,并配套设计了一项衡量人类生产力的基准测试。本研究的目标是构建一套术语体系,使 GIS 领域中的智能体辅助功能具备可实现性、可评测性与可比性。
本文简要概述了现有的地理基础模型(GeoFM)与地理人工智能(GeoAI)模型,以及用于评估这些模型的核心数据集与基准测试。地理基础模型仍是一个新兴且快速发展的研究领域。依据基础模型(FM)或地理基础模型(GeoFM)在各项研究中所起的作用,可将现有GeoFM相关研究大致分为以下三类:1)通过提示工程(prompt engineering)与任务特定微调(task-specific fine-tuning),将现有基础模型适配至地理空间任务;2)构建面向地理空间任务的先进大语言模型(LLM)智能体框架;3)通过具备地理感知能力的模型训练与微调,开发新型地理基础模型。
近期,GeoBenchX [20] 和 GEOBench-VLM [7] 等基准测试拓展了该领域,致力于解决地理空间任务中的多步骤、多模态及基于工具的推理挑战。ScienceAgentBench [6] 覆盖地理信息科学等四个科学学科,共包含102项任务,并基于自包含的 Python 程序进行严格的执行导向评估,使其直接适用于地理信息系统(GIS)……
Golem — 面向地理空间行业的自演化 GeoAI 智能体 — 支持自然语言驱动的 GDAL/PostGIS 工作流、学习式流水线复用、生成式工具脚手架、审批与审计治理机制,并可通过 WebUI、TUI 及即时通讯(IM)渠道访问。本 GitHub 仓库由 MEKXH(开发者)维护。主要编程语言:Go。GitHub Star 数:165。最后更新时间:2026-03-29。
这些约束条件为训练与验证 GeoAI 模型提供了独特机会,从而提升其地理可迁移性。上述要素共同凸显了 GeoAI 的独特性——它不仅是一种人工智能应用,更是一个专门应对地球科学中时空复杂性的学科领域。地球科学领域一项开创性的 GeoAI 建模工作是 Prithvi-EO 的开发;这是一种新型地理空间 AI 基础模型,基于具有国家及全球覆盖范围的时间序列遥感(EO)数据进行训练,旨在提取独特的语义与光谱特征。
本文探讨了构建面向地理人工智能(GeoAI)的多模态基础模型(Foundation Models, FMs)所蕴含的潜力与面临的挑战。我们首先通过在七个任务上评估多个现有基础模型的性能,考察其在多个地理空间领域(包括地理空间语义、健康地理学、城市地理学和遥感)中的适用性。
本研究通过覆盖多种应用场景,旨在评估当前最先进的大语言模型(LLM)在生成地理处理工作流及解决地理空间问题方案方面的能力,并揭示此类模型在空间数据科学自动化进程中日益增强的作用。为构建基准测试任务,我们综合整理了2025年之前公开可获取的GIS教程(例如Esri Learn平台、高校实验指导材料)中的地理空间问题求解实例。
本研究探讨人类动态在地理空间人工智能(GeoAI)中的作用,强调其重塑地理空间研究的潜力。
大语言模型(LLMs)正在重塑地理空间人工智能(GeoAI),在数据处理、空间分析和决策支持方面带来新的能力。本文探讨了开源范式在此变革中的关键作用。尽管专有大语言模型具有易用性,但通常限制了定制化、互操作性和透明度,而这些对于专业地理空间任务至关重要。相反,开源替代方案通过促进更高的适应性、可复现性以及社区驱动的创新,显著推动了地理信息科学(GIScience)的发展。开放框架使研究人员能够定制解决方案,集成前沿方法(如强化学习、高级空间索引),并遵循FAIR(可发现、可访问、可互操作、可重用)原则。然而,对任何大语言模型日益增长的依赖,要求我们审慎考虑安全漏洞、伦理风险以及对人工智能生成地理空间成果的健全治理。本文认为,地理信息科学的进步不应依赖单一模型类型,而应通过培育一个多样化、可互操作的生态系统来实现,该系统结合开源基础以促进创新、定制化的地理空间模型以及跨学科协作。通过对开源大语言模型在更广泛GeoAI格局中机遇与挑战的批判性评估,本文为有效利用大语言模型推动空间研究、政策制定与决策的公平、可持续且科学严谨的发展,贡献了一场深入的学术讨论。
卫星数量的持续增加提升了地球观测的时间分辨率,使基于卫星的洪水制图成为业务化洪水监测中一种颇具前景的方法。作为地理空间人工智能(GeoAI)的重要应用,基于深度学习的卫星影像洪水制图方法通过从海量遥感数据中学习复杂的空谱模式,显著提升了预测性能。然而,深度学习模型决策过程的不透明性仍是其融入关键科学与业务工作流的主要障碍。这凸显了系统评估模型解释是否符合既定遥感领域知识的必要性。为填补这一研究空白,本研究提出了ADAGE(Alignment between Domain Knowledge And GeoAI Explanation Evaluation,领域知识与GeoAI解释对齐性评估)框架。该框架旨在系统评估深度学习模型解释与既定遥感知识(特别是地表独特光谱特性)之间的对齐程度。ADAGE框架采用通道分组SHAP(SHapley Additive exPlanations)方法,估算分组输入通道对像素级预测的贡献。在两项基于卫星的洪水制图任务上的实验表明,ADAGE框架能够:(1)定量评估模型解释与基于领域知识生成的参考解释之间的对齐性;(2)通过对齐得分辅助领域专家识别未对齐的解释。本研究有助于弥合GeoAI可解释性与地球观测领域知识之间的鸿沟,提升GeoAI模型的适用性。
建模空间异质性及其相关临界转变,仍是地理学与环境科学中的基础性挑战。尽管传统的地理加权回归(GWR)和深度学习模型提升了预测能力,但它们往往难以阐明状态依赖的非线性关系——即驱动因子在不同异质区域中可能呈现相反的功能作用。我们提出一种受热力学启发的可解释地理空间人工智能框架,将统计力学与图神经网络相融合。该框架将空间变异性概念化为系统负荷(E)与容量(S)之间的热力学竞争,从而解耦驱动空间过程的潜在机制。我们在三个模拟数据集及三个跨领域真实数据集(住房市场、心理健康患病率、野火引发的PM2.5异常)上开展实验,结果表明,新框架成功识别出预测因子在不同状态下的角色反转现象,而标准基线模型均未能发现此类现象。值得注意的是,该框架明确诊断出2023年加拿大野火事件期间系统向负荷主导态的相变过程,从而将物理机制转变与统计异常区分开来。这些发现表明,引入热力学约束可在保持复杂空间系统强预测性能的同时,提升地理人工智能(GeoAI)的可解释性。
视觉基础模型是地理空间人工智能(GeoAI)领域的前沿方向,该领域为地理空间问题求解与地理知识发现应用并拓展人工智能技术。由于其能够通过学习和提取海量地理空间数据中的重要图像特征,从而实现强大的图像分析能力,因此具有重要意义。本文评估了首个地理空间基础模型——IBM-NASA联合研发的Prithvi模型在关键地理空间分析任务——洪水淹没制图中的表现。将该模型与基于卷积神经网络及视觉Transformer的架构进行对比,评估其在洪水区域制图精度方面的性能。实验采用Sen1Floods11基准数据集,并基于测试数据集以及模型从未见过的全新数据集,评估各模型的预测能力、泛化能力与迁移能力。结果表明,Prithvi模型具备良好的迁移能力,尤其在未见过区域的洪水区域分割任务中表现出显著优势。研究同时指出,Prithvi模型在多尺度表征学习的采用、面向高层图像分析任务的端到端流程开发,以及输入数据波段灵活性方面仍有改进空间。
Volume 40, Issue 4, April 2026, Page 947-978 .
面向地理空间AI智能体(GeoAI)的开源框架,支持任务规划、多工具协同执行、假设验证、动态重新规划以及全流程操作可追溯性。涉及主题包括:ai-agents、django、geoai、geospatial、gis、llm。本GitHub仓库由开发者juaquicar维护,主要编程语言为Python,最后更新时间为2026-03-26。
Arion 是由 GeoRetina Inc. 开发的首个面向地理空间分析的智能体式 AI 桌面应用。相关主题包括:AI、AI 智能体(AI-agents)、地理空间 AI(GeoAI)、地理空间分析(geospatial-analysis)、地理信息系统(GIS)。本 GitHub 仓库由组织 GeoRetina 维护。主要编程语言为 TypeScript。GitHub 星标数:65。最后更新时间:2026-03-26。# Arion:面向智能体式地理空间 AI 分析的跨平台桌面应用 🎉 v0.10.1 已发布!Arion v0.10.1 现已上线,新增 Codex 集成、连接器标签页及用户界面优化。详见发布说明!📦 二进制版本即将发布!适用于 Windows、macOS 和 Linux 的二进制构建版本即将上线,敬请期待!Arion 是一款**跨平台桌面应用**,专为高级地理空间分析与智能体式工作流设计。基于 Electron、React(TypeScript)与 Vite 构建,Arion 原生支持 **Windows、macOS 和 Linux**,使用户能够利用本地及
数十年来,地理空间数据长期处于孤立状态……进而实现跨领域分析。为应对这一挑战,地理空间人工智能(GeoAI)(Iyer 等,2025)已从专用模型发展为面向地球观测的通用基础模型(Zhu 等,2024)。
多模态大语言模型(LLM)的快速发展为人工智能开辟了新领域,实现了文本、图像及空间信息等多样化大规模数据类型的融合。本文探讨了多模态大语言模型(MLLM)在地理空间人工智能(GeoAI)中的潜力,该领域利用空间数据应对地理语义、健康地理学、城市地理学、城市感知以及遥感等领域的挑战。我们提出一种专用于地理空间应用的MLLM(OmniGeo),能够处理和分析异构数据源,包括卫星影像、地理空间元数据和文本描述。通过结合自然语言理解与空间推理的优势,本模型提升了指令遵循能力以及GeoAI系统的准确性。实验结果表明,该模型在多种地理空间任务上优于特定任务模型及现有LLM,在处理多模态特性的同时,于零样本地理空间任务中取得了具有竞争力的表现。代码将在论文发表后公开。
大型语言模型(LLM)与地理信息系统(GIS)的融合标志着自主空间分析范式的转变。然而,由于地理空间工作流具有复杂、多步骤的特性,对这类基于LLM的智能体进行评估仍具挑战性。现有基准主要依赖静态文本或代码匹配,忽视了动态运行时反馈以及空间输出的多模态特性。为弥补这一空白,我们提出GeoAgentBench(GABench),一个专为工具增强型GIS智能体设计的动态交互式评估基准。GABench提供了一个真实的执行沙箱,集成了117个原子级GIS工具,覆盖6个核心GIS领域中的53类典型空间分析任务。鉴于精确的参数配置是动态GIS环境中执行成功的主要决定因素,我们设计了参数执行准确率(Parameter Execution Accuracy, PEA)指标,采用“最终尝试对齐”(Last-Attempt Alignment)策略,量化隐式参数推断的保真度。作为补充,我们提出一种基于视觉-语言模型(Vision-Language Model, VLM)的验证方法,用于评估数据-空间准确性及制图风格符合度。此外,为应对因参数错配和运行时异常导致的频繁任务失败,我们开发了一种新型智能体架构——Plan-and-React,该架构通过解耦全局编排与逐步响应式执行,模拟专家级认知工作流。针对七种代表性LLM开展的大量实验表明,Plan-and-React范式显著优于传统框架,在多步推理与错误恢复方面尤其突出,实现了逻辑严谨性与执行鲁棒性的最优平衡。我们的研究揭示了当前能力边界,并确立了一个稳健的
本文探讨了构建面向地理空间人工智能(GeoAI)的多模态基础模型所蕴含的潜力与挑战。我们首先通过在两项地理空间语义任务上测试现有大语言模型(LLMs)(如GPT-2和GPT-3)的性能,验证该思路的优势。