最新
按新入库时间从新到旧展示最新进入资料库的内容,覆盖论文、博客、数据集、项目与工具。
2026年1月2日,NASA宇航员克里斯·威廉姆斯在国际空间站的奋进号气闸舱内进行航天服适配性验证时面向摄像机微笑。该程序旨在确认航天服密封性良好且配置正确,评估舒适度与活动灵活性,并有助于预防潜在的安全风险。威廉姆斯与 fellow NASA 宇航员杰西卡·梅尔完成了约 […]
滑坡是造成重大人员伤亡和经济损失的主要地质灾害。可靠的灾害风险评估需要高质量的时空事件数据,然而目前中国尚无公开可获取且具有细粒度精度的滑坡事件目录。为此,我们基于新闻报道,构建了2008年至2024年中华人民共和国大陆地区滑坡事件目录。
像Snapchat这样的社交媒体应用功能的迭代速度几乎与潮流变化同步。为保持竞争力,其母公司Snap已采用NVIDIA在Google云服务上的开源数据处理库以加速开发进程。每项新功能在向超过9.4亿月活跃用户推出前,均需经过一系列……
视觉语言模型(VLMs)已逐渐成为理解室内场景的主要范式,但仍面临度量与空间推理的挑战。现有方法依赖端到端视频理解或大规模空间问答微调,本质上将感知与推理耦合在一起。本文探讨解耦感知与推理是否能提升空间推理能力。我们提出一种面向静态三维室内场景推理的智能体框架,将大语言模型(LLM)显式地锚定于三维场景图(3DSG)。不同于直接输入视频,每个场景通过专用感知模块构建为持久的3DSG。为隔离推理性能,我们从真实标注中实例化3DSG。该智能体仅通过结构化的几何工具与场景交互,这些工具揭示了物体尺寸、距离、位姿及空间关系等基本属性。在VSI-Bench静态数据集上的实验结果表明,在理想感知条件下,本方法达到了空间推理性能的上限,且显著优于此前工作,提升幅度高达16%,且无需特定任务微调。相较于基础VLM,我们的智能体变体在平均性能上提升了33%至50%。这些发现表明,显式的几何锚定可显著提升空间推理性能,并提示结构化表示是纯粹端到端视觉推理的一种有力替代方案。
尽管地震等自然灾害可通过统一的全球传感器网络进行监测,但洪水等水文气象灾害却缺乏标准化的观测基础设施。长期以来,由于缺乏高质量、全球范围的历史数据用于模型训练与验证,突发性洪水的精准预测受到严重制约。这一‘数据荒漠’构成了关键挑战。尽管1万条记录看似数量可观,但与训练和验证全球规模人工智能所需的数据量相比,仍微不足道。
WAXAL为非洲语音技术提供了关键的开放获取基础。该资源包含27种本土语言的大量自动语音识别(ASR)和文本转语音(TTS)数据,采用高度宽松的许可协议,赋能非洲人工智能生态系统构建更能反映本地区独特语言多样性的稳健语音系统。通过解决超过一亿人口的语言数据稀缺问题,WAXAL旨在推动区域人工智能研究生态的发展。
准确 delineate 内陆水体并监测地表水动态变化对于水文研究和气候适应具有重要意义。表面水与海洋地形(SWOT)卫星显著提升了全球地表水观测能力。然而,在复杂的内陆环境中,SWOT 数据常受条带噪声和质量控制(QC)标记失效的影响,易导致水体提取错误或遗漏狭窄水体。为解决上述问题,我们提出了 SDNet,一种基于 Transformer 的多尺度框架。该设计在抑制高频条带噪声的同时保留细尺度水文边界,显著提高了水体提取的可靠性。不同水体的实验结果表明:(1)SDNet 在各类尺度水体上均实现了高精度。相较于基于 QC 的分类方法,大型水体的水体交集率(WIR)和背景交集率(BIR)分别提升了 23.68% 和 45.96%;中等尺度水体的 WIR 进一步提升 2.83%,小型水体的 WIR 提升达 3.57 倍。(2)利用 ICESat-2 高程数据进行交叉验证显示,SWOT 高程误差与跨轨距离呈正相关。在 100 m 分辨率下,中位误差范围为 0.117 m 至 0.181 m,在 250 m 分辨率下为 0.111 m 至 0.170 m,平均绝对误差保持在分米级以下。(3)季节性水文分析揭示了不同类型水体对水位变化响应模式的显著差异:自然湖泊主要受气候过程驱动,而调控型水库则表现出由人类调控主导的多峰动态特征。
多种景观因子,包括坡度、植被密度和地表粗糙度,共同影响非路径环境中的行人移动速率。以往大多数行人移动速率模型仅在相对粗略的时空分辨率下量化这些因子的影响,忽略了LiDAR数据中蕴含的细尺度信息以及瞬时移动轨迹。先前研究也主要依赖参数化函数拟合来建模非路径移动速率。本文首次采用随机森林——一种适用于非线性关系且能稳健评估变量重要性的机器学习算法——对瞬时移动速率进行分析。以机载LiDAR提取的坡度、植被密度和地表粗糙度的主成分作为随机森林模型的预测变量,该模型在独立测试数据集上解释了超过77%的观测移动速率方差(R² = 0.778)。置换重要性分析表明,LiDAR提取的坡度是移动速率最重要的预测因子,其次为植被密度,最后为地表粗糙度。综合考察坡度、植被密度和地表粗糙度的重要性,提供了超越单一因子效应的新见解,揭示了这些景观因子如何相互作用以塑造行人移动速率。尽管坡度是最重要的单一预测因子,但我们的结果表明,植被密度和地表粗糙度具有独特且非线性的影响,只有在联合评估时才更为清晰。值得注意的是,植被密度对移动速率的抑制作用强于地表粗糙度,即使在粗糙度较低的情况下,高植被密度仍表现出显著的限制作用。
及时监测玉米早期生长对粮食安全与农业管理至关重要,但现有大多数制图方法依赖成熟期光谱特征,导致应用滞后。本研究提出TCBA-ViT,一种融合卷积神经网络与视觉Transformer的混合框架,通过双路径卷积块注意力模块(CBAM)和时间注意力机制,联合捕捉多时相哨兵-2影像中的局部光谱细节与全局时间动态信息。基于美国玉米带2019—2024年六年的数据,TCBA-ViT可最早于6月(V7期,播种后四周)可靠识别玉米,并在7月下旬实现稳定超过90%的准确率,较生理成熟期提前近两个月。跨年度实验表明模型对年际变异与作物轮作具有强鲁棒性,跨区域测试验证了良好的空间泛化能力,在250公里范围内F1分数保持在0.85以上,450公里范围内维持在0.80以上。相较于现有基准模型,TCBA-ViT在不同年份与区域中均实现了更早且更精确的分类结果。消融分析进一步凸显了CBAM与时间注意力对性能提升的关键作用。本研究回答了玉米可被分类的最早时间及模型可泛化的空间范围问题,为早期季节动态作物分类与大范围农业监测提供了经验证的框架,支持可持续决策制定。
微软研究院推出了以人为中心的语音处理流程Paza,以及首个针对低资源语言的排行榜PazaBench。该平台涵盖39种非洲语言和52个模型,并在真实场景中通过社区测试验证。原文发布于微软研究院。
尽管其有效性(或成本效益)仍存争议,通过生态廊道连接栖息地残片仍是缓解野生动物栖息地丧失与破碎化对生物多样性负面影响的一种策略。然而,生态廊道规划与决策过程中常涉及多种主观且不确定的因素,涵盖环境、经济、社会及政治等多个方面,这些因素可能限制廊道的连续性,导致廊道由孤立的栖息地片段组成,形成物种移动的“踏脚石”。为支持此类“踏脚石”廊道的规划,我们设计并实现了一种基于栅格的GIS模型,用于表征并搜索跨越多种土地覆盖类型镶嵌景观中的最优孤立斑块序列。该模型具有两个关键特点:首先,它同时选择踏脚石斑块及其连通路径,共同构成完整廊道,这一表示方式有助于空间规划中引导生物体沿廊道移动,例如确定植树或生态修复的位置;其次,与现有最小成本路径模型不同,本模型无需对土地覆盖类型进行适宜性(或成本)的量化,仅需其排序关系即可。尽管主观性和不确定性仍可能存在,但已显著降低。我们将该模型应用于卢旺达的一项保护项目,旨在通过建立本地植物篱笆以促进传粉鸟类扩散,增强两个国家公园之间的连通性。结果表明,该模型能够快速完成踏脚石廊道候选路径的初步划定,并有效支持保护规划的早期探索阶段。
If you've worked with LLM Agents, you've felt this pain: the same model can feel brilliant in one framework and useless in another. An agent might crush a tool-use leaderboard but fail spectacularly at a simple, real-world task. This gap between benchmark performance and practical usability is one of the biggest challenges in the field. When we designed M2, we knew we had to tackle this problem head-on. This led us to two core, and sometimes conflicting, objectives:
The data describe freeway car-following behavior (such as velocity, acceleration, and relative position) for the car-following instances observed during 59 data collection runs, performed through the Federal Highway Administration (FHWA) Turner Fairbank Highway Research Center’s (TFHRC) Living Laboratory (LL). Data were collected using an Instrumented Research Vehicle (IRV) along freeways in northern Virginia to better understand work zone driver behaviors. The USDOT Volpe National Transportation Systems Center (Volpe Center) identified, isolated, and classified individual car following instances from within the raw datasets (classification parameters included roadway type, level of congestion, and speed limit), then processed, refined, and cleaned the dataset. This table contains the car-following instances recorded by Volpe staff. See also the runs table (https://datahub.transportation.gov/Automobiles/Enhancing-Microsimulation-Models-for-Improved-Work/285w-yjf5) and radar table (https://datahub.transportation.gov/Automobiles/Enhancing-Microsimulation-Models-for-Improved-Work/uvrt-varj).
随着人工智能工作负载范围的扩大,小型专用模型在泛化能力方面面临挑战,且对大量标注训练样本的需求持续增加。相反,基础模型(FMs)通过自监督学习在互联网规模的无标签数据上进行训练,已被证明可通过极少微调适配多种任务。尽管大型基础模型在自然语言处理和计算机视觉领域已展现出显著影响,但面向地理空间应用的基础模型研究仍受限于较小规模模型,因为预训练更大模型需要配备先进硬件加速器的海量计算资源。当前卫星星座每日收集超过100TB的数据,生成的图像具有数十亿像素且为多模态特性。此类地理空间数据带来独特挑战,同时也为开发基础模型创造了新机遇。我们通过在公开可用数据上进行预训练,研究了百亿规模基础模型及其在高性能计算(HPC)环境中的训练特征。从端到端角度考察了模型规模扩展对解决方案性能与影响的作用。相较于1亿参数模型,我们更大的30亿参数模型在场景分类Top1准确率上最高提升达30%。此外,我们详细介绍了在美洲首台百亿亿次级超算系统——前沿(Frontier)超级计算机上的性能实验,采用PyTorch的全分片数据并行库(Fully Sharded Data Parallel)研究了不同的模型并行与数据并行策略。具体而言,我们研究了视觉变换器架构(ViT)的不同变体,对规模高达150亿参数的ViT模型进行了性能分析。通过讨论不同并行配置下的吞吐量与性能瓶颈,为如何优化大规模地理空间基础模型的训练提供了深入见解。
鼠类如老鼠和家鼠与多种健康风险相关,已知可传播35种以上疾病。识别鼠类活动频繁的区域有助于地方政府和害虫控制机构有效规划干预措施并实施灭鼠工作。本文展示了如何监测和可视化…
在许多热带地区,当地雨林正面临严重破坏风险,森林砍伐是一个重大问题。过去50年间,约17%的亚马孙雨林遭到破坏,一些热带生态系统正接近临界点,一旦越过该点,恢复将几乎不可能。导致森林砍伐的一个关键因素是原材料开采……
工业共生通过在工业主体网络间建立副产品与废弃物的循环体系,旨在最大化经济效益的同时最小化环境压力。在此类网络中,整体环境压力不再等于各主体环境压力之和,而是取决于网络整体运行效率。目前,理解、管理或优化此类网络的方法仍是一个开放性问题。本文提出一种用于模拟工业主体间副产品流动的仿真模型,旨在从宏观视角建立共生交换的建模方法。该模型考虑了两种主要机制对共生过程多目标优化的影响:首先,能够研究经济系统地理属性的作用,即主体在空间上的分布情况;其次,能够分析基于距离将互补主体聚类的效应,通过主体副产品间的空间相关性实现。仿真结果揭示了对宏观政策具有重要意义的模式:第一,地理属性是影响共生过程宏观表现的重要因素;第二,空间相关性(可解释为如生态工业园区等规划集群)可显著提升宏观绩效,但仅在严格实施条件下才能实现;第三,通过将模型与欧洲污染物排放与转移登记数据库中的真实数据进行对比,并利用数据集中企业位置的地理编码信息,提供了概念验证。本研究为交互式研究开辟了新的可能性。
本文将现有抽象模型扩展并应用于巴西的一个实证大都市区域。该模型名为SEAL(空间经济代理实验室),构建了一个支持公共政策事前分析的框架。模型旨在利用官方数据和各市的空间边界,实现政策实验。当前版本涵盖住房、劳动力和商品三个市场。家庭成员会经历年龄变化、消费、进入劳动力市场以及房屋交易。各市征收单一消费税,并将税收投入用于提升生活质量。我们检验了由多个市合并而成的单一大都市政府是否最符合其居民利益。20次模拟运行的初步结果表明,这种情况可能成立。未来的发展方向包括提升模型性能,以支持更高比例人口及更多次运行,从而增强模型的稳健性。
代理模型(ABM)是一种自下而上的建模方法,其中系统中的每个实体均被唯一地表示为一个独立决策的代理。大规模的涌现行为在ABM中对种群规模敏感。因此,模拟中的代理数量应能反映所建模系统的实际情况,某些领域中可能达到数百万甚至数十亿个体。在商品化多核处理器上实现可接受扩展性的自然解决方案是将模型分解,使每个组件能够由不同线程并发独立处理。本文提出了一种多线程Java实现的PPHPC ABM,旨在实现两个目标:1)将该实现的性能与现有的NetLogo实现进行比较;2)研究不同并行化策略在共享内存架构上的模拟性能影响。结果表明:1)模型并行化可带来显著的性能提升;2)不同的并行化策略在性能与模拟可重现性方面存在特定权衡;3)PPHPC是一个有效的参考模型,可用于从性能和统计准确性角度比较不同实现或并行化策略。
随机自适应方法在深度学习任务的神经网络训练中被广泛使用。然而,其经验上的成功尚未得到充分理论解释……
中分辨率成像光谱仪(MODIS)热异常与每日火灾数据第6.1版产品每八天生成一次,空间分辨率为1公里,属于三级产品。MOD14A1将连续八天的火灾数据整合在一个文件中。科学数据集(SDS)图层包括火灾掩膜、像素质量指标、最大火辐射功率(MaxFRP)以及火像素在扫描中的位置。每个图层包含八天数据采集期间每天每像素的信息。
09Q1 版本 6.1 产品提供了中分辨率成像光谱仪(MODIS)波段 1 和波段 2 的地表光谱反射率估算值,并对大气条件(如气体、气溶胶和瑞利散射)进行了校正。除提供 250 米地表反射率波段外,还附带两个质量层。对于每个像元,从 8 日合成周期内的所有获取数据中选择一个值。像元选取标准包括云覆盖和太阳天顶角;当多个获取数据满足标准时,选用通道 3(蓝光)值最小的像元。
发表日期:2026年5月 来源:《人工智能》,第354卷 作者:贝蒂娜·法齐尼亚、塞尔吉奥·弗莱斯卡、菲利波·福尔法罗
中分辨率成像光谱辐射计(MODIS)MCD43A4 版本 6.1 正射方向双向反射分布函数(BRDF)校正反射率(NBAR)数据集每日生成,使用 Terra 和 Aqua MODIS 16 天的数据,空间分辨率为 500 米。该数据集消除了观测角度的影响,从方向性反射率中获得稳定且一致的 NBAR 产品。数据按时间加权至第九日,反映在文件名中的儒略日期中。用户应参考用户指南,利用波段特定的质量标志,筛选出最高质量的完整反演结果,以满足自身科学应用需求。MCD43A4 提供了 MODIS 波段 1 至 7 的 NBAR 以及简化的强制质量层。使用该产品时,应同时查阅相应的 MCD43A2 数据文件以获取必要的质量信息。