论文与情报流
聚合权威论文、预印本与机构内容源,支持按主题、来源与关键词筛选,面向实验室持续开展科研跟踪与资料沉淀。
声环境质量已成为评估城市宜居性与整体生态状况的关键指标。基于声压级(SPL)的传统监测方法难以全面反映居民的主观听觉体验;且此类方法依赖昂贵的监测网络、多源数据或复杂的衰减模型,观测尺度仍局限于街道或点位。为克服上述局限,本研究提出一种建模框架,融合多尺度、多光谱遥感影像与深度学习技术,实现全国范围内住宅街区尺度声环境不适度(SEDL)的估算与验证。SEDL估算模型构建过程包括:1. 通过大规模问卷调查获取反映居民主观感知的SEDL数据,共回收有效问卷516,804份;2. 利用卫星遥感获取的多光谱影像构建多尺度可见光与不可见光谱特征;3. 设计并应用基于视觉Transformer(ViT)的深度学习模型。该模型通过学习多光谱、多尺度遥感数据与调查所得SEDL之间复杂的非线性关系,实现仅以遥感数据为输入的端到端SEDL估算。实验结果表明,所提模型在测试集上表现优异(MAE = 0.28,R² = 0.63),能有效捕捉居民听觉感知与遥感特征之间的耦合关系,从而在保持高空间分辨率的同时,将城市SEDL估算能力扩展至中国大陆所有主要城市。分析进一步揭示了
尽管其有效性(或成本效益)仍有争议,但通过保护廊道连接生境残余斑块仍是缓解野生动物生境丧失与破碎化对生物多样性负面影响的一种途径。然而,保护廊道的规划与决策过程常涉及多种主观且不确定的因素,涵盖环境、经济、社会及政治等多个维度。这些因素可能限制廊道的空间连续性,导致廊道由彼此隔离的生境斑块构成,仅作为物种移动的“踏脚石”。为支持此类“踏脚石”廊道的规划,我们设计并实现了一种基于栅格的GIS模型,该模型可在多类型土地覆被镶嵌格局中表征并搜索最优的孤立斑块序列。本模型具有两个关键创新点:第一,它同步选取踏脚石斑块及其穿越路径,二者共同构成廊道;这种表达方式有助于开展需引导生物沿廊道移动的空间规划行动,例如确定植被种植或生态修复的具体位置;第二,与现有最小成本路径模型不同,本模型无需对土地覆被类型进行适宜性(或成本)的量化赋值,仅依赖其相对排序。尽管主观性与不确定性仍无法完全消除,但已显著降低。我们将该模型应用于卢旺达一项保护项目,旨在通过营造本土植物树篱以支持传粉鸟类扩散,从而增强两座国家公园之间的连通性。结果表明,该模型可快速初步划定踏脚石廊道的候选路线,并有助于保护规划早期探索阶段的工作。
COVID-19大流行造成的严重冲击凸显了准确、及时预测住院人数对有效医疗资源规划的重要性。然而,大多数预测模型在疫情变种暴发期间(即最需要预测支持时)表现欠佳。本研究提出一种新颖的并行流长短期记忆网络(LSTM)框架,用于预测美国各州每日新增住院人数。该框架引入了一种时空特征——住院病例社交邻近度(Social Proximity to Hospitalizations, SPH),该特征源自Meta公司的社交连接指数(Social Connectedness Index),旨在提升预测性能。SPH作为州际人口互动的代理变量,可捕捉跨空间与时间的传播动态。本架构同时建模短期与长期时间依赖关系,并采用多时间尺度集成策略,在预测一致性与误差控制之间取得平衡。在Delta与Omicron变异株暴发期间,本模型与COVID-19预测中心(COVID-19 Forecast Hub)集成模型的对比评估表明其性能更优:在Omicron暴发期间,本模型在7日、14日、21日与28日预测时间尺度上,平均每州分别较集成模型减少27、42、54与69例预测误差。数据消融实验进一步证实SPH具备显著预测能力,凸显其对提升预测模型性能的有效性。本研究不仅推动了住院人数预测方法的发展,也强调了SPH等时空特征在建模传染病复杂传播动态中的重要意义。
我们提出 MiniVLA-Nav v1,一个面向语言条件物体接近(Language-Conditioned Object Approach, LCOA)导航任务的仿真数据集:给定一段简短的自然语言指令,NVIDIA Nova Carter 差分驱动机器人需在四个逼真的 Isaac Sim 环境(办公室、医院、完整仓库、含多层货架的仓库)中导航至指定物体,并在其 1 米范围内停止。全部 1,174 个 episode 均配有一条指令,以及同步采集的 640×640 RGB 图像、度量深度图(float32,单位:米)和实例分割掩码;同时提供由基于视觉的比例控制器生成的连续控制信号(线速度 v 和角速度 ω)及 7×7 tokenized 专家动作标签,采样频率为 60 Hz。轨迹多样性通过三类起始距离层级(近:1.5–3.5 米;中:3.5–7.0 米;远:全局人工筛选点位;起始距离与轨迹长度的 Pearson 相关系数 r = 0.94)、12 类物体、18 个训练模板及 12 个分布外(OOD)同义改写模板予以保障。本数据集包含五个评估划分,分别用于评估分布内准确性、模板-改写鲁棒性及分布外物体类别泛化能力。该数据集已公开发布于 https://huggingface.co/datasets/alibustami/miniVLA-Nav
端到端(E2E)自动驾驶提供了一种将感知输入直接映射为驾驶动作的有前景方法。然而,高昂的标注成本与随时间推移而加剧的数据质量退化,阻碍了其在真实场景中的长期部署。尽管结合模仿学习(IL)与强化学习(RL)是提升策略性能的常用策略,但传统RL训练依赖延迟的、基于事件的奖励——策略仅从碰撞等灾难性结果中学习,易导致过早收敛至次优行为。为克服上述局限,我们提出GSDrive框架,利用三维高斯泼溅(3DGS)实现可微分、基于物理的奖励塑形,以改进E2E驾驶策略。本方法在3DGS仿真器中嵌入基于流匹配的轨迹预测器,支持多模态轨迹探测:对候选轨迹进行前向 rollout 以评估其预期奖励。该设计通过将奖励函数锚定于物理仿真的交互信号,在IL与RL之间建立双向知识交换,从而提供即时、稠密的反馈,而非稀疏的灾难性事件反馈。在重建的nuScenes数据集上开展的闭环实验表明,本方法性能优于现有基于仿真的RL驾驶方法。代码开源地址:https://github.com/ZionGo6/GSDrive。
出版日期:2026年5月4日在线发表;来源:《可持续城市与社会》(Sustainable Cities and Society);作者:叶云、刘宇、佟彤、吴群
出版日期:2026年5月3日在线发布;来源:《可持续城市与社会》;作者:刘璇、桑德·德梅伊、亚历克斯·唐克斯、杨杜娟
出版日期:2026年5月4日在线发布;来源:《可持续城市与社会》(Sustainable Cities and Society);作者:Kedi Liu、Ranran Wang、Arnold Tukker、Samir KC、Rutger Hoekstra
出版日期:2026年5月3日在线发表;来源:《可持续城市与社会》(Sustainable Cities and Society);作者:刘旺银、张子琦、陈宇轩、王思源、刘婉
在低空空域中保障先进空中交通(Advanced Air Mobility, AAM)的安全高效运行,需依赖一套可靠、鲁棒且具韧性的监视系统,该系统须能在正常及非标工况下持续完成航空器的探测、识别与跟踪任务。为满足此需求,本研究构建了一个涵盖可靠性(reliability)、鲁棒性(robustness)与韧性(resilience)的综合3R建模框架,面向先进空中交通监视系统(Surveillance for Advanced Air Mobility, SAM),重点支撑多类型传感器网络的最优设计与运行。在正常运行条件下,可靠性模型确定满足监视覆盖与探测要求所需的基准传感器类型、数量及布设位置;针对外部扰动(如恶劣天气或AAM交通需求突增),鲁棒性模型识别为维持系统性能所必需的额外传感器配置;对于因主用传感器失效导致的监视中断,韧性模型则制定备用传感器部署与调度策略,以提供临时监视覆盖、最小化运行中断,并保障AAM作业的安全延续。
从超音速湍流到宇宙大尺度结构,复杂的物理系统均由连续的多尺度动力学所支配。尽管现代机器学习架构在映射此类系统的高维可观测量方面表现优异,但尚不清楚其是否内化了基本物理定律,抑或仅在离散统计相关性之间进行插值。标准可解释人工智能(XAI)架构——尤其是基于扰动和梯度显著性的方法——依赖于像素级扰动,这会产生非物理的人工伪影,并将输入推离有效的经验分布。为解决此问题,我们提出一种由约束扩散分解(Constrained Diffusion Decomposition, CDD)驱动的诊断框架;CDD 是一种基于扩散的多尺度数据分解算法,支持通过尺度感知的修改实现物理约束下的数据生成与模型评估。我们将该框架应用于去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM),在连续的、基于 CDD 的尺度空间中执行确定性干预。结果表明,在适度的物理扰动下,无约束生成模型表现出局域结构冻结与非线性失稳,而非类似偏微分方程(PDE)的连续响应。该网络无法维持跨尺度连续性,导致生成轨迹在进入未见物理状态时发生偏离。通过合成一系列物理自洽的状态 continuum,这一尺度感知方法构建了一个受控测试环境,用于评估算法脆弱性,并为未来架构尊重自然宇宙中多尺度因果关系提供了严格的物理约束基础。
阴影是遥感影像(RSI)中普遍存在的问题,会降低视觉质量,并严重制约目标检测、语义分割等下游任务的性能。现有大多数方法将阴影检测与阴影去除视为彼此分离、级联执行的任务,导致流程繁琐且易产生误差累积。此外,许多深度学习方法依赖成对的含阴影与无阴影图像进行训练,而此类配对数据在实际应用中往往难以获取。为应对上述挑战,我们提出阴影感知与去除统一框架(SARU),一种结构紧凑的两阶段框架:首先,其双分支检测模块(DBCSF-Net)融合多色彩空间特征与语义特征,生成高保真阴影掩膜,有效区分阴影区域与暗色物体;随后,基于该掩膜,一种新颖的无需训练的物理算法(N²SGSR)利用单幅输入图像中邻近非阴影区域的光照特性,实现光照恢复。为支持严格评估并推动后续研究,我们还构建了两个新基准数据集:遥感影像阴影检测数据集(RSISD)与单图像阴影去除基准(SiSRB)。大量实验表明,SARU 在公开 AISD 数据集及我们新构建的基准上均达到当前最优性能。通过整体整合阴影检测与去除以抑制误差传播,并消除对配对训练数据的依赖,SARU 构建了一个鲁棒且实用的遥感影像分析框架。源代码与数据集已公开发布于:https://github.com/AeroVILab-AHU/SARU-Framework。
高分辨率遥感数据的指数级增长正面临星地传输的严重瓶颈。受限的下行链路带宽迫使采用极高压缩比,从而不可逆地损毁对目标检测等下游机器感知任务至关重要的高频结构细节。尽管当前超分辨率技术试图恢复这些细节,但基于回归的方法常导致纹理过度平滑,而生成式扩散模型又频繁引入结构幻觉,进而误导检测系统。为应对这一权衡问题,我们提出结构感知潜在扩散(Structure-Aware Latent Diffusion, SALD)框架——一种非对称的边缘-云协同超分辨率系统。在资源受限的边缘端,该系统将影像解耦为高度压缩的低频载荷与轻量级软结构先验;传输该解耦表示可最小化带宽消耗。在算力强大的云端,我们在扩散主干网络中引入结构门控大核(Structure-Gated Large Kernel, SGLK)模块与语义引导引擎(Semantic-Guidance Engine, SGE),利用所传输的结构先验对大核卷积进行门控,从而有效捕获航拍场景固有的长程依赖关系,并主动抑制生成式幻觉。在MSCM与UCMerced数据集上的大量实验表明:即使在极端带宽约束下,SALD仍能实现更优的感知质量(LPIPS),并显著提升下游任务性能,包括场景分类与小目标检测。
遥感红外图像超分辨率旨在从低分辨率输入中恢复更清晰的热观测结果,同时保持目标轮廓、场景布局及辐射稳定性。与可见光图像超分辨率不同,热成像纹理较弱,且对局部锐化不稳定更为敏感,因此互补的局部与全局建模尤为关键。本文介绍了我们针对NTIRE 2026红外图像超分辨率挑战赛所提出的解决方案:一种融合HAT-L分支与MambaIRv2-L分支的双分支系统。推理流程在HAT分支上应用测试时局部变换,在MambaIRv2分支上采用八路自集成,并在图像空间进行固定等权融合。我们在官方挑战赛评分之外,还在由Caltech Aerial RGB-Thermal数据集生成的12幅合成×4倍热图像样本上进行了可复现评估;融合输出在PSNR、SSIM及总体Score指标上均优于任一分支单独结果。结果表明,红外超分辨率可得益于局部强表达能力的Transformer重建与全局稳定的状态空间建模之间的显式互补性。
全球导航卫星系统(GNSS)正面临日益加剧的故意干扰威胁,严重削弱了依赖高精度定位与授时的关键基础设施。当前的位置误差校正(PEC)方法主要集中于多径传播误差,未能充分利用卫星星座所具有的时空一致性。本文将干扰抑制问题重构为动态图回归任务,提出接收端中心化的深度时序图网络——Jamming Guardian(JaGuard),用于在固定位置(如路侧单元)估计并校正干扰引发的位置漂移。该方法将卫星-接收机场景建模为每秒1帧(1 Hz epoch)的异构星型图;其核心模块——异构图卷积LSTM(Heterogeneous Graph ConvLSTM)融合空间上下文(信噪比SNR、方位角、仰角)与短期时间动态,以预测二维位置偏差。在包含两类商用接收机实测数据的真实世界数据集上(施加合成射频干扰,涵盖三种干扰器类型,功率范围−45至−70 dBm),JaGuard在所有先进基线方法中持续取得最低的平均绝对误差(MAE)。在强干扰条件(−45 dBm)下,其MAE维持于2.85–5.92 cm;干扰减弱后进一步提升至亚2 cm水平。在混合功率干扰数据集上,JaGuard亦全面超越所有基线:GP01接收机MAE为2.26 cm,U-blox 10接收机MAE为2.61 cm。即使训练数据极度匮乏(仅10%),JaGuard仍保持稳定,误差被约束于15–20 cm范围内,且未出现基线方法中显著的方差激增现象。结果证实,对星座图物理退化过程进行动态建模,是实现鲁棒干扰校正的必要条件。
气溶胶光学厚度(AOD)反演对地球观测至关重要,支撑空气质量监测与气候研究等应用。传统基于物理的AOD反演方法将问题建模为逐像素反演,依赖辐射传输建模、内存密集型查找表及辅助气象数据。尽管近期数据驱动方法展现出潜力,但多数未能充分利用高光谱影像的空间-光谱一致性,导致反演结果空间不一致且对噪声敏感。本研究首次探索基础人工智能(Foundation AI)模型用于AOD反演,并提出ViTCG——一种基于通道分组(Channel-wise Grouping)的空间回归框架的视觉Transformer模型,可降低反演偏差与误差。ViTCG以高光谱大气顶层辐射亮度为输入,联合建模空间上下文与光谱信息。在PACE辐射亮度观测数据上的验证表明,相较于Prithvi等当前最先进的基础模型,ViTCG的均方误差降低62%,并生成空间一致的AOD场。
城市规划者需要最新、全球覆盖且一致的街道网络模型与指标,以衡量韧性与绩效、建模可达性,并精准实施提升本地生活质量的干预措施。本文提供了面向全球每一处都市区的最新街道网络模型与指标,采用全球人类住区图层(Global Human Settlement Layer)发布的2025年都市区边界,使用户可将这些数据与数百项其他城市属性进行关联分析。其工作流处理了覆盖189个国家、10,351个都市区的1.8亿个OpenStreetMap节点与3.6亿个OpenStreetMap边。相关代码、模型与指标均公开发布,可供复用。这些资源不仅推动了超越抽样局限的全球街道网络科学研究,亦支持资源匮乏地区开展本地化分析——在这些地区,此类模型与指标通常难以获取。
多智能体强化学习(MARL)已在大规模交通控制、自动驾驶车辆和机器人等领域取得显著进展。受生物系统启发——其中角色自然涌现以支持协作——基于角色的MARL方法被提出,以增强复杂任务中的协同学习能力。然而,现有方法仅从智能体训练过程中的过往经验中推导角色,忽略了角色对其未来轨迹的影响。本文提出一项关键洞见:智能体的角色应塑造其未来行为,从而实现有效协同。为此,我们提出了“通过动力学模型实现角色发现与多样性”(R3DM),一种新颖的基于角色的MARL框架;该框架通过最大化智能体角色、观测到的轨迹及预期未来行为之间的互信息来学习涌现式角色。R3DM首先利用对比学习对过往轨迹进行优化,推导出中间角色;这些中间角色用于构建内在奖励,再结合所学习的动力学模型,促进不同角色在未来行为上的多样性。在SMAC与SMACv2基准环境上的实验表明,R3DM优于当前最先进的MARL方法,将多智能体协同效果提升至最高20%的胜率。代码开源地址为:https://github.com/UTAustin-SwarmLab/R3DM。
自然灾害的发生频率与强度持续上升,每年造成数千亿美元损失,并对基础设施与人类生计构成日益严峻的威胁。准确的屋顶材料数据对于建模建筑物在地震、洪水、野火和飓风等自然灾害下的脆弱性至关重要,但此类数据目前仍不可得。为填补这一空白,我们提出 RoofNet——迄今规模最大、地理覆盖最广的新型多模态数据集,包含来自184个地理分布广泛地点的逾51,500个样本,将高分辨率地球观测(EO)影像与人工整理的文本标注配对,用于全球屋顶材料分类。RoofNet 包含来自气候与建筑特征各异区域的地理多样性卫星影像,标注了14类关键屋顶材料,旨在通过视觉-语言建模(VLM)提升全球暴露度数据集的精度。我们从气候与建筑特征显著不同的区域采样 EO 影像瓦片,构建具有代表性的数据集。其中6,000张图像由领域专家协作完成标注,用于微调 VLM 模型;采用兼顾地理位置与材料特性的提示调优(prompt tuning)以增强类别可分性。微调后的模型被应用于其余 EO 瓦片,其预测结果经基于规则的方法与人工参与(human-in-the-loop)验证进一步优化。除材料标签外,RoofNet 还提供丰富的元数据,包括屋顶形状、轮廓面积、太阳能板存在性,以及混合屋顶材料(如暖通空调系统)的指示信息。因影像来源存在许可限制,早期实验所用数据集已被移除。基于该数据集所得结果应谨慎解读;使用合规数据的更新实验正在进行中。
出版日期:2026年8月1日;来源:《环境遥感》(Remote Sensing of Environment),第341卷;作者:张辉、史舟、高伦、孙志斌、何冰、王义翔、王宏权
本文提出一种面向高维非线性时空分数阶扩散方程的深度Picard迭代框架。该方法基于非线性分数阶Feynman–Kac不动点公式,通过蒙特卡洛模拟对应的分数阶动力学过程,替代对Caputo记忆项及非局部分数阶拉普拉斯算子的直接离散。每次Picard更新均通过随机标签生成实现,并借助有监督神经网络回归完成,从而避免涉及分数阶微分算子的残差最小化。分数阶轨迹由离散化的beta稳定次序器与旋转对称alpha稳定Lévy过程的球面游走(walk-on-spheres)型模拟耦合生成。二维及高维测试问题的数值实验表明该方法具有稳定的Picard收敛性与高精度近似能力,所报告测试维度最高达d=100。
交通流预测在智能交通系统(ITS)中发挥核心作用,支撑实时决策、拥堵管理及长期规划。然而,现有诸多方法面临实际应用局限:多数时空模型依赖中心化数据训练、采用数值化表征,且可解释性有限;近期基于大语言模型(LLM)的方法虽提升了推理能力,但通常假设数据可集中获取,未能充分刻画真实交通系统固有的分布式与异构特性。为应对上述挑战,本研究提出 FedLLM(Federated LLM),一种面向可解释多步短期交通流预测(15–60 分钟)的隐私保护型分布式框架。该框架包含四项关键贡献:1)复合选择得分(CSS),一种数据驱动的高速公路路段选择机制,用以刻画不同交通区域间的结构多样性;2)面向交通领域适配的 LLM,经结构化交通提示(prompt)微调,该提示编码了空间、时间与统计上下文;3)FedLLM 框架本身,支持异构客户端间的协同训练,仅交换轻量级 LoRA 适配器参数;4)一种结构化提示表征,支持上下文推理与跨区域泛化。FedLLM 的设计使各客户端可在本地学习交通模式,同时通过高效参数交换参与全局模型构建,在降低通信开销的同时保障数据隐私,并适用于非独立同分布(non-IID)的交通数据场景。实验结果表明,FedLLM 在预测性能上优于中心化基线模型,并生成结构清晰、可解释的输出。