统一知识库检索

全局检索与知识浏览

跨论文、博客、数据集线索、项目和工具统一检索。检索结果可以继续跳转到独立问答页，做语义追问和来源核验。

检索条件

内容类型

来源类型

热门主题

当前展示 24 条，共 3531 条

筛选后的知识库结果

首页/全局检索

项目

GitHub Repositories

geographic intelligent agents

geographic large models

geumjin99/GISclaw: GISclaw——一个面向全栈地理空间分析的开源大语言模型驱动智能体系统

geumjin99/GISclaw: GISclaw: An Open-Source LLM-Powered Agent System for Full-Stack Geospatial Analysis

GISclaw——一个面向全栈地理空间分析的开源大语言模型（LLM）驱动智能体系统。本 GitHub 仓库由开发者 geumjin99 维护，最后更新时间为 2026-03-27。🚧 即将发布 🚧 论文录用后，将公开源代码、评估脚本及基准测试结果。

geumjin99

2026/03/27

来源详情

论文

arXiv

GeoAI

GIS

利用地理空间基础模型进行小型沙质岛屿海岸线 delineation

Utilizing a Geospatial Foundation Model for Coastline Delineation in Small Sandy Islands

我们对NASA与IBM联合开发的Prithvi-EO-2.0地理空间基础模型在利用卫星影像进行小型沙质岛屿海岸线提取方面的表现进行了初步评估。我们收集并标注了来自马尔代夫两个岛屿的225幅多光谱图像数据集，并公开发布该数据集；同时，我们在包含5至181幅图像的训练子集上对Prithvi模型的300M和600M参数版本进行了微调。实验结果表明，即使仅使用5幅训练图像，模型仍能取得优异性能（F1值为0.94，IoU值为0.79）。研究结果展示了Prithvi模型强大的迁移学习能力，凸显了此类模型在数据匮乏地区支持海岸带监测的巨大潜力。

Tishya Chhabra, Manisha Bajpai, Walter Zesk

2025/11/13

PDF 来源详情

论文

Nature

PaperDiscovery

迈向负责任的地理空间基础模型 | Nature Machine Intelligence

Towards responsible geospatial foundation models | Nature Machine Intelligence

亟需能够处理各类数据源、其模态以及不同空间与时间分辨率的策略与工具。过去几十年间，深度学习的兴起与计算能力的增长，已彻底改变了遥感（EO）数据的处理方式，其应用涵盖地球系统科学、城市计算、地理空间语义学和遥感等领域。

2025/08/20

来源详情

资讯

CARTO Blog

Industry

地理空间基础模型：研讨会要点

Geospatial Foundation Models: Workshop Takeaways

探讨地理空间基础模型的现状，涵盖表征学习到人口动态等主题，并汇总CARTO与巴塞罗那超级计算中心（BSC）联合举办的研讨会见解。

CARTO Blog

2026/02/10

来源详情

论文

arXiv

GeoAI

GIS

基于地理空间基础模型的滑坡灾害制图：地理泛化能力、数据稀缺性与波段适应性

Landslide Hazard Mapping with Geospatial Foundation Models: Geographical Generalizability, Data Scarcity, and Band Adaptability

滑坡对生命、基础设施和环境造成严重破坏，因此准确及时的制图对于灾害预防与应对至关重要。然而，传统深度学习模型在应用于不同传感器、区域或训练数据有限的情况下往往表现不佳。为应对这些挑战，我们提出一个涵盖传感器、标签和领域三个维度的分析框架，用于适应地理空间基础模型（GeoFMs），重点聚焦于Prithvi-EO-2.0在滑坡制图中的应用。通过一系列实验，我们发现该模型在性能上持续优于任务特定的卷积神经网络（U-Net、U-Net++）、视觉Transformer（Segformer、SwinV2-B）以及其他GeoFMs（TerraMind、SatMAE）。该模型基于全球预训练、自监督学习以及可适应的微调机制，在面对光谱变化时表现出鲁棒性，即使在标签数据稀缺条件下仍能保持较高精度，并在多种数据集和地理环境中展现出更可靠的泛化能力。与此同时，我们也指出了仍存在的挑战，如计算成本较高以及可用于滑坡研究的可复用AI就绪训练数据有限。总体而言，本研究将GeoFMs定位为实现更稳健、可扩展的滑坡风险减缓与环境监测方法的重要一步。

Wenwen Li, Sizhe Wang, Hyunho Lee

2025/11/06

PDF 来源详情

论文

arXiv preprint arXiv:2405.19730

UrbanCompLab

GeoLargeModel

空间数据智能基础模型研究

Research on the spatial data intelligent foundation model

在大数据时代，基于云边协同数据的智能教学空间模型构建是当前教育创新探索的重点。在理解构建模型的基础上，依托云边协同数据的安全存储体系，本文深入探讨了该技术的实现路径，并最终获得相关成果。

Wang, Shaohua, Xie, Xing, Li, Yong

2024/01/01

来源详情

论文

arXiv

GeoAI

GIS

基于微调地理空间基础模型的城市热岛检测与模拟

Detection and Simulation of Urban Heat Islands Using a Fine-Tuned Geospatial Foundation Model

随着城市化进程和气候变化的推进，城市热岛效应日益频繁且加剧。为制定有效的缓解策略，城市需要详细的气温数据。然而，基于传统机器学习模型和有限数据基础设施的预测分析方法在欠覆盖区域常导致不准确的预测。在此背景下，基于全球非结构化数据训练的地理空间基础模型展现出强大的泛化能力，且仅需极少微调，为传统方法受限的场景提供了替代方案。本研究对地理空间基础模型进行微调，以预测未来气候情景下的城市地表温度，并通过模拟植被策略探讨其对土地覆盖变化的响应。微调后的模型像素级下采样误差低于1.74 °C，且与地面实测模式一致，表现出最高达3.62 °C的外推能力。

David Kreismann

2025/09/20

PDF 来源详情

论文

arXiv

GeoAI

GIS

首个在轨验证的地理空间基础模型

First On-Orbit Demonstration of a Geospatial Foundation Model

地理空间基础模型（GeoFM）有望为地球观测（EO）任务提供广泛的泛化能力，尤其在数据受限条件下表现突出。然而，其庞大的模型规模对资源受限的航天器硬件部署构成挑战。为此，我们提出了一种基于视觉Transformer（ViT）的GeoFM紧凑型变体，在保持下游任务性能的同时实现了机载执行。通过对五个下游任务的评估以及在两种典型飞行环境中的验证，表明模型压缩与领域适应对于降低模型尺寸和资源需求、同时在实际运行条件下维持高性能至关重要。我们进一步展示了在国际空间站搭载的IMAGIN-e有效载荷上实现的可靠在轨推理。这些结果确立了从大型GeoFM到可飞行、资源高效的部署路径，拓展了地球观测任务中机载人工智能的可行性。

Andrew Du, Roberto Del Prete, Alejandro Mousist

2025/12/01

PDF 来源详情

项目

GitHub Repositories

GIS

GeoAI

zhouning/gisdataagent: 基于 Google ADK 构建的 AI 驱动地理空间分析平台。v16.0：SIGMOD 2026 L3 自主智能体——语义算子、多智能体协作、错误恢复、防护机制、遥感分析、工具演化、AI 技能创建。2966+ 项测试，21/21 种设计模式。

zhouning/gisdataagent: AI-powered geospatial analysis platform built on Google ADK. v16.0: SIGMOD 2026 L3 autonomous agent - semantic operators, multi-agent collaboration, error recovery, guardrails, remote sensing, tool evolution, AI skill creation. 2966+ tests, 21/21 design patterns.

基于 Google Agent Developer Kit (ADK) 构建的 AI 驱动地理空间分析平台。v16.0 版本实现 SIGMOD 2026 定义的 L3 级自主智能体能力，涵盖语义算子、多智能体协作、错误恢复、防护机制（guardrails）、遥感分析、工具演化及 AI 技能创建。包含 2966 余项测试用例，完整实现《Agentic Design Patterns》所列全部 21 种设计模式。涉及主题包括 agentic-design-patterns、ai-agent、autonomous-agent、chainlit、data-fusion、deep-reinforcement-learning。本 GitHub 仓库由开发者 zhouning 维护，主要编程语言为 Python，GitHub Star 数为 9，最后更新时间为 2026-04-01。

zhouning

2026/04/01

来源详情

论文

arXiv

GeoAI

GIS

ZeroFlood：一种数据高效洪水易发性制图的地理空间基础模型

ZeroFlood: A Geospatial Foundation Model for Data-Efficient Flood Susceptibility Mapping

洪水易发性制图（FSM）对于灾害预防至关重要，但在缺乏数据的地区仍具挑战性，因为水动力模型需要密集的地球物理输入。本文提出ZeroFlood，一种用于数据高效洪水易发性制图的地理空间基础模型框架。该方法通过基于模态思维（TiM）的推理对地理空间基础模型（GFMs）进行微调，实现仅依赖基本地球观测数据（如Sentinel-1或Sentinel-2影像）进行洪水预测。利用数据丰富区域的配对地球观测数据与模拟洪水地图，ZeroFlood通过跨模态表示学习弥合数据差距。基于TerraMind和Prithvi GFMs的实验表明，TiM提升了模型鲁棒性，其中TerraMind-Large配置的F1得分为67.21。结果证明了基于基础模型的FSM在洪水风险管理中具有可扩展性和数据高效性。

Hyeongkyun Kim, Orestis Oikonomou

2025/10/27

PDF 来源详情

论文

arXiv

GeoAI

GIS

地理空间基础模型助力可持续发展目标进展

Geospatial Foundation Models to Enable Progress on Sustainable Development Goals

基础模型（FMs）是大规模预训练的人工智能（AI）系统，已彻底改变自然语言处理和计算机视觉领域，并正推动地理空间分析与地球观测（EO）的发展。它们有望在各类任务中实现更好的泛化能力、可扩展性以及仅需少量标注数据即可高效适应。然而，尽管地理空间基础模型迅速普及，其在现实世界中的实用性及其与全球可持续发展目标的契合度仍缺乏深入探索。我们提出了SustainFM，一个基于17项可持续发展目标的综合性基准测试框架，涵盖从资产财富预测到环境灾害检测等极其多样的任务。本研究对地理空间基础模型进行了严谨且跨学科的评估，为理解其在实现可持续发展目标中的作用提供了关键洞见。研究发现：（1）尽管并非在所有任务中均表现最优，但基础模型通常在多种任务和数据集上优于传统方法。（2）评估基础模型应超越准确率，纳入可迁移性、泛化能力及能源效率等关键指标，以确保其负责任的应用。（3）基础模型能够提供可扩展的、以可持续发展目标为导向的解决方案，广泛适用于应对复杂的可持续性挑战。至关重要的是，我们倡导从以模型为中心的研发转向以影响为导向的部署模式，并强调能源效率、对领域偏移的鲁棒性以及伦理考量等指标的重要性。

Pedram Ghamisi, Weikang Yu, Xiaokang Zhang

2025/05/30

PDF 来源详情

论文

International Journal of Geographical Information Science

UrbanCompLab

GIS

LandGPT：一种基于多源数据的地块级土地利用分类多模态大语言模型

LandGPT: a multimodal large language model for parcel-level land use classification with multi-source data

《国际地理信息科学杂志》；第39卷；第12期；页码2862-2885；2025年发表；出版机构Taylor & Francis。

Zhu, Geyuan, Tang, Mi, Ma, Yueheng

2025/01/01

来源详情

论文

arXiv

GeoAI

GIS

地理空间基础模型的缩放定律：以PhilEO Bench为例的研究

Scaling Laws for Geospatial Foundation Models: A case study on PhilEO Bench

基础模型（FMs）通过大规模预训练在多个领域实现了最先进性能。在地球观测（EO）领域，近年来海量卫星数据档案（拍字节级）的可用性推动了地理空间基础模型（GFMs）的发展。然而，关于数据集规模、模型架构与模型规模如何共同决定下游性能的基本问题仍待解答。本文系统地探索该设计空间，基于三个数据集规模进行模型预训练与微调：PhilEO Globe（0.5TB）、FastTOM（2TB，本文首次提出）以及MajorTOM（23TB）。评估了三种架构族：Geo-Aware U-Net（CNN）、ViT-UPerNet（Transformer）和Mamba（状态空间模型），涵盖参数量从44M到300M的多种模型规模。所有模型均在PhilEO Bench上进行基准测试，任务包括道路密度与建筑密度回归、土地覆盖分割，并与现有GFMs如TerraMind和Prithvi-EO-2.0进行对比。结果表明，在少样本设置下，基于CNN的模型依然具有较强竞争力，其中200M参数的Geo-Aware U-Net在回归任务中优于更大规模的架构。然而，当扩展至拍字节级数据集时，ViT-UPerNet表现最佳，尤其在MajorTOM（23TB）上的语义分割任务中优势显著。最后，我们首次对Mamba模型在地球观测领域的应用进行了广泛评估，凸显其潜在的效率优势，但需进一步的大规模预训练才能完全达到CNN与ViT的性能水平。本文公开发布全部代码、预训练模型及FastTOM数据集，以支持可复现性并促进对GFMs缩放定律的深入研究。

Nikolaos Dionelis, Riccardo Musto, Jente Bosmans

2025/06/18

PDF 来源详情

论文

International Journal of Geographical Information Science

PublisherJournal

GeoAI

MGIM：面向地块级地理推断的掩码建模框架

MGIM: a masked modeling framework for land parcel-level Geo-Inference

Xiang Zhang Yao Yao Chenglong Yu Zhihui Hu Geyuan Zhu Mariko Shibasaki Liangyang Dai Yanduo Guo Qingfeng Guan Ryosuke Shibasaki a UrbanComp Lab, School of Geography and Information Engineering, China University of Geosciences, Wuhan, Hubei, Chinab LocationMind Institution, LocationMind Inc, Chiyoda, Tokyo, Japanc Hitotsubashi Institute for Advanced Study, Hitotsubashi University, Kunitachi, Tokyo, Japand School of Computer Science, China University of Geosciences, Wuhan, Chinae Faculty of Engineering, Reitaku University, Kashiwa, Chiba, Japanf Interfaculty Initiative in Information Studies & Graduate School of Interdisciplinary Information Studies, The University of Tokyo, Tokyo, JapanXiang Zhang is a graduate student at China University of Geosciences (Wuhan), China. His research interests include GeoAI and human mobility.Yao Yao is a Professor at China University of Geosciences (Wuhan) and Hitotsubashi University. His research interests include spatiotemporal big data mining, social geographic computing, and urban geographic information systems.Chenglong Yu is a graduate student at China University of Geosciences (Wuhan), China and an intern student at LocationMind Institute, LocationMind Inc., Japan. His research interests include GeoAI and Large Language Model.Zhihui Hu is a graduate student at China University of Geosciences (Wuhan), China. His research interests are geospatial big data mining and geospatial foundation modelling.Geyuan Zhu is a graduate student at China University of Geosciences (Wuhan), China and an intern student at LocationMind Institute, LocationMind Inc., Japan. His research interests are intelligent agriculture, and large language model.Mariko Shibasaki is a Consultant at LocationMind Institute, LocationMind Inc., Japan. She has received the master degree from the Graduate School of Frontier Sciences, the University of Tokyo. Her interest is application geospatial foundation models to sustainable and inclusive development involved with human society and the natural environment.Liangyang Dai is a graduate student at China University of Geosciences (Wuhan). His research interests are geospatial big data mining and health geography.Yanduo Guo is an undergraduate student at China University of Geosciences(Wuhan), China and an intern student at LocationMind Institute, LocationMind Inc., Japan. His research interests include GeoAI and retrieval-augmented large language models.Qingfeng Guan is a Professor at China University of Geosciences (Wuhan). His research interests include high-performance spatial intelligence computation and urban computing.Ryosuke Shibasaki is a Project Professor at the School of Interdisciplinary Information Studies at the University of Tokyo, Japan. His research interests cover mobile big data analysis, satellite/aerial imagery and sensor data analysis, including automated mapping with deep learning, human behavior modeling/simulation, and data assimilation of discrete moving objects.

2026/02/18

来源详情

论文

arXiv

GeoAI

GIS

多模态地理空间基础模型综述：技术、应用与挑战

Survey of Multimodal Geospatial Foundation Models: Techniques, Applications, and Challenges

基础模型已深刻变革自然语言处理与计算机视觉领域，其影响正重塑遥感图像分析。凭借强大的泛化能力与迁移学习特性，基础模型天然契合遥感数据的多模态、多分辨率及多时相特征。为应对该领域的独特挑战，多模态地理空间基础模型（GFMs）应运而生，成为专门的研究前沿。本综述从模态驱动视角系统回顾多模态GFMs，涵盖五种核心视觉与视觉-语言模态。我们探讨成像物理差异与数据表征方式如何影响交互设计，并分析对齐、融合与知识迁移的关键技术，以应对模态异质性、分布偏移与语义鸿沟问题。训练范式、模型架构及任务特定适应策略的进展得到系统评估，同时梳理了大量新兴基准。代表性多模态视觉与视觉-语言GFMs在十项下游任务中被评估，深入剖析其架构特点、性能表现与应用场景。涵盖土地覆盖制图、农业监测、灾害响应、气候研究与地理空间情报等真实案例研究，展示了GFMs的实际应用潜力。最后，本文指出领域泛化、可解释性、效率与隐私等关键挑战，并展望未来研究的可行方向。

Liling Yang, Ning Chen, Jun Yue

2025/10/27

PDF 来源详情

论文

arXiv

GeoAI

GIS

更智能地微调，而非更努力：面向地理空间基础模型的参数高效微调

Fine-tune Smarter, Not Harder: Parameter-Efficient Fine-Tuning for Geospatial Foundation Models

地球观测（EO）对于监测环境变化、应对灾害以及管理自然资源至关重要。在此背景下，基础模型有助于遥感图像分析，以准确且高效地提取相关地理信息。然而，随着这些模型规模的增大，微调面临日益严峻的计算资源与成本挑战，限制了其可及性与可扩展性。此外，全量微调可能导致预训练特征遗忘，甚至降低模型泛化能力。为解决这一问题，参数高效微调（PEFT）技术提供了一种有前景的解决方案。本文针对多种基础模型架构与PEFT技术，在五个不同的地球观测数据集上进行了广泛实验，评估其有效性。结果提供了全面的对比分析，揭示了PEFT方法在何种情境下以及如何支持预训练地理空间模型的适应。我们证明，PEFT技术在性能上可达到甚至超越全量微调，并提升模型对未见地理区域的泛化能力，同时显著降低训练时间与内存需求。额外实验探讨了架构选择（如解码器类型或元数据使用）的影响，建议采用UNet解码器并避免使用元数据作为最优配置。我们已将所有评估的基础模型与技术集成至开源工具包TerraTorch，以支持快速、可扩展且低成本的模型适配。

Francesc Marti-Escofet, Benedikt Blumenstiel, Linus Scheibenreif

2025/04/24

PDF 来源详情

资讯

Google Research Blog

Industry

Google Earth AI：利用基础模型与跨模态推理解锁地理空间洞察

Google Earth AI: Unlocking geospatial insights with foundation models and cross-modal reasoning

随着单一模型能力不断增强，我们发现许多现实世界的问题需要跨领域的综合洞察。回答诸如“飓风可能在何处登陆？哪些社区最易受灾害影响，应如何准备？”等复杂问题，需要对影像、人口和环境信息进行综合推理。Earth AI 将前沿模型与地理空间推理代理相结合，以应对全球重大挑战。

Google Research Blog

2025/10/23

来源详情

资讯

CARTO Blog

Industry

利用 CARTO 工作流将地理空间基础模型转化为决策

Turning Geospatial Foundation Models into Decisions using CARTO Workflows

CARTO 现支持直接在地理空间基础模型（geospatial foundation model）的嵌入向量（embeddings）上运行分析。通过可视化、聚类与变化检测，将空间数据转化为决策依据。

CARTO Blog

2025/12/16

来源详情

资讯

AWS Geospatial ML Blog

Industry

借助 AWS 上的地理空间基础模型革新地球观测

Revolutionizing earth observation with geospatial foundation models on AWS

本文探讨了如何在 Amazon SageMaker 上部署领先的 GeoFM（Clay Foundation 的 Clay 基础模型，可在 Hugging Face 获取），以实现大规模推理与微调。

Karsten Schroer

2025/05/30

来源详情

论文

arXiv

GeoAI

GIS

生成式地理空间扩散模型能否作为判别式地理空间基础模型表现出色？

Can Generative Geospatial Diffusion Models Excel as Discriminative Geospatial Foundation Models?

自监督学习（SSL）已革新遥感（RS）领域的表征学习，推动地理空间基础模型（GFMs）利用海量未标注卫星影像以支持多样化的下游任务。目前，GFMs主要采用对比学习或掩码图像建模等目标，因其在学习可迁移表征方面表现优异。然而，生成式扩散模型在图像生成过程中展现出捕捉遥感任务所需多粒度语义的潜力，却尚未在判别性应用中得到充分探索。这引发了一个问题：生成式扩散模型是否同样具备卓越性能，并可作为具备足够判别能力的GFMs？本文通过SatDiFuser框架给出回答，该框架将基于扩散的生成式地理空间基础模型转化为强大的判别性遥感预训练工具。通过对多阶段、依赖噪声的扩散特征进行系统分析，我们提出了三种融合策略，以有效利用这些多样化表征。在遥感基准测试上的大量实验表明，SatDiFuser优于当前最先进的GFMs，在语义分割任务中实现最高达+5.7%的mIoU提升，在分类任务中实现+7.9%的F1分数提升，证明了基于扩散的生成式基础模型在判别性能上可与甚至超越传统判别式GFMs。源代码地址：https://github.com/yurujaja/SatDiFuser。

Yuru Jia, Valerio Marsocci, Ziyang Gong

2025/03/11

PDF 来源详情

项目

GitHub Repositories

GeoAI

geographic intelligent agents

juaquicar/GeoAgents：面向地理空间AI智能体的开源框架，支持规划、多工具执行、假设验证、重新规划及全流程可追溯性

juaquicar/GeoAgents: Open-source framework for geospatial AI agents with planning, multi-tool execution, hypothesis verification, replan, and full traceability.

面向地理空间AI智能体（GeoAI）的开源框架，支持任务规划、多工具协同执行、假设验证、动态重新规划以及全流程操作可追溯性。涉及主题包括：ai-agents、django、geoai、geospatial、gis、llm。本GitHub仓库由开发者juaquicar维护，主要编程语言为Python，最后更新时间为2026-03-26。

juaquicar

2026/03/26

来源详情

论文

arXiv

GeoAI

GIS

基于微调地理空间基础模型的都市热岛检测与模拟以预测微气候影响

Detection and Simulation of Urban Heat Islands Using a Fine-Tuned Geospatial Foundation Model for Microclimate Impact Prediction

随着城市化进程和气候变化的推进，都市热岛效应日益频繁且严重。为制定有效的缓解策略，城市需要详细的气温数据，但传统机器学习模型在数据有限的情况下往往产生不准确的预测，尤其是在服务不足的区域。基于全球非结构化数据训练的地理空间基础模型提供了一种有前景的替代方案，其具备强大的泛化能力，仅需少量微调即可应用。本研究通过量化绿地的降温效应并将其与模型预测结果进行对比，建立了都市热模式的经验真实数据，用以评估模型的准确性。随后，对基础模型进行微调，以预测未来气候情景下的地表温度，并通过模拟修复（inpainting）展示了其在缓解支持中的实际价值。结果表明，基础模型为数据匮乏地区评估都市热岛缓解策略提供了有力工具，有助于建设更具气候韧性的城市。

Jannis Fleckenstein, David Kreismann, Tamara Rosemary Govindasamy

2025/10/22

PDF 来源详情

工具

GitHub Repositories

geospatial

gis

gaopengbin/GeoAgent: AI-powered geospatial analysis platform — 35+ GIS tools, Cesium 3D globe, natural language interaction

gaopengbin/GeoAgent: AI-powered geospatial analysis platform — 35+ GIS tools, Cesium 3D globe, natural language interaction. 用自然语言操控地图，AI 自动完成空间分析与可视化。

An AI-powered geospatial analysis platform featuring over 35 GIS tools, a Cesium-based 3D globe, and natural language interaction. Users control maps via natural language, and AI automatically performs spatial analysis and visualization. Topics include 3d-globe, ai, cesiumjs, fastapi, geospatial, and gis. This GitHub repository is maintained by gaopengbin (developer). Primary language: Python. GitHub stars: 1. Last updated: 2026-03-24.

gaopengbin

2026/03/24

来源详情

论文

arXiv

GeoAI

GIS

地理空间基础模型在图像分析中的应用：评估与增强NASA-IBM Prithvi模型的领域适应能力

Geospatial foundation models for image analysis: evaluating and enhancing NASA-IBM Prithvi's domain adaptability

地理空间基础模型（GFMs）的研究因在地理空间人工智能（AI）领域中具备实现高泛化能力和领域适应性的潜力，从而显著降低个体研究者的模型训练成本，已成为当前热点。与ChatGPT等大型语言模型不同，构建用于图像分析的视觉基础模型，尤其是在遥感领域，面临诸多挑战，例如如何将多样化的视觉任务统一为通用问题框架。本文评估了近期发布的NASA-IBM GFMs Prithvi在多个基准数据集上的高层图像分析任务预测性能。选择Prithvi的原因在于它是首个基于高分辨率遥感影像时序数据训练的开源地理空间基础模型。通过一系列实验，对比了Prithvi与其他预训练专用任务AI模型在地理空间图像分析中的表现。本文提出并整合了新的策略，包括波段适应、多尺度特征生成以及微调技术，将其融入图像分析流程，以增强Prithvi的领域适应能力并提升模型性能。深入分析揭示了Prithvi的优势与不足，为改进Prithvi及未来地理空间视觉基础模型的开发提供了重要启示。

Chia-Yu Hsu, Wenwen Li, Sizhe Wang

2024/08/31

PDF 来源详情

第 1 / 148 页