UrbanComp Lab | 学习资料库

中国地质大学（武汉）位置智能与城市感知实验室

搜索资料库团队官网

实验室合照

关于平台

UrbanComp Lab | 学习资料库

面向中国地质大学（武汉）位置智能与城市感知实验室的正式研究资料平台。系统持续采集权威论文、机构博客、开放资源与实验室论文，形成统一知识库，支持日级热点浏览、语义检索、来源核验与智能问答。

实验室与平台

中国地质大学（武汉）位置智能与城市感知实验室

该系统不是普通导航页，而是实验室面向日常学习、科研跟踪、资料沉淀与专题观察的知识基础设施。平台围绕 GeoAI、GIS、遥感、轨迹数据、城市交通、时空知识图谱、复杂网络、地理模拟、多源多模态地理数据与地理大模型持续扩展。

系统功能

面向实验室日常学习、论文跟踪、资料沉淀、专题观察与研究启发。用户可以在同一站点内完成检索、浏览、摘要查看、来源核验、知识追踪与灵感启发。

运行方式

当前采用本地部署。前端固定运行在 5021，API 固定运行在 5022，内容刷新在固定时刻自动执行，研究日报 PDF 默认在每天 09:10 更新，首页摘要与灵感在每天固定时间生成，抓取、翻译、归类、索引、摘要与问答统一由后端任务链管理。

功能结构

平台不是单页展示，而是由总览、最新流、资讯流、论文/数据集/项目/工具专题页、灵感页和内部问答组成的完整知识系统。

首页

展示搜索入口、今日摘要、灵感预览、更新状态与访问统计，是整站的总览与快速进入页。

最新

按入库时间展示最新进入资料库的内容，并提供带期数的研究日报 PDF 下载与历史归档入口。

研究日报

围绕实验室五个研究方向生成可下载 PDF，今天作为第 001 期建立归档，后续在每天 09:10 持续更新。

资讯

聚合机构博客、平台动态、智慧城市、规划设计与地图平台更新，支持正文抓取与中文翻译。

论文 / 数据集 / 项目 / 工具

论文和数据集卡口更严格；项目和工具基于资源抽取与主题信号归类落位。

灵感

每天围绕真实知识库条目生成 2-3 个主题，每个主题给出 5 个研究问题、难点、路线与可能成果。

发现

每天输出来源建议、关键词建议与扩展主题建议，作为扩源与补抓的公开参考页，不直接自动改主配置。

问答

内部权限页面，面向实验室成员提供带来源引用的连续问答，不对外开放公开互动。

实验室名称

中国地质大学（武汉）位置智能与城市感知实验室

实验室主页

统一知识入口

论文、资讯、数据集、项目、工具与团队论文进入同一资料库，支持跨来源检索、聚合浏览与站内详情查看。

结构化情报处理

系统自动整理标题、摘要、作者、标签、资源链接、来源网址、中文翻译、正文与摘要卡片。

语义检索与问答

搜索与问答共用混合语义检索链路，支持主题召回、连续追问与来源核验。

研究启发生成

灵感页面每天围绕真实知识库资料生成研究问题、难点、路线与可能成果，并为实验室重点方向保留轮换主题，服务于研究生选题和方向启发。

发现与扩源

发现页面结合 Brave 搜索与知识库分析，给出来源建议、关键词建议和主题扩展建议，帮助系统持续补充高质量内容。

定时增量更新

系统按固定频次自动刷新资料、翻译新内容、更新语义索引，并在每天 09:10 生成可下载的研究日报 PDF 归档。

自动更新机制

资料刷新、灵感生成、实验室日报和首页热词共用同一套后台调度链路。用户前台看到的是结果，不暴露内部控制项。

最近完成：2026-06-19 12:18

资料抓取

每天 12 次

抓取论文、资讯、官方开放数据与团队相关资源，随后执行过滤、翻译、归类与索引。

研究雷达

每天 2 次

按研究方向提炼趋势摘要、趋势信号与核心观点，作为 /latest 页的主视图。

灵感卡片

每天 1 次

每天早上生成研究启发卡片，基于真实知识库资料组织问题、难点、路线与可能成果。

发现建议

每天 1 次

每天生成来源建议、关键词建议与扩展主题建议，用于后续扩源与补抓，并将高质量建议注入下一轮发现流程。

研究日报 PDF

每天 08:55

每天 09:10 发布带期数的研究日报 PDF，并在最新页持续保留历史下载入口。

首页热词

每小时轮换

从知识库与关键词画像中选择当前时段值得关注的主题词，只保留有真实资料支撑的方向。

新增内容如何进入站内

新增内容不会“抓到即展示”。所有内容都要先通过实验室研究边界，再经过翻译、摘要、归类和索引处理，最后进入相应页面。

抓取候选：从 arXiv、期刊 RSS、机构资讯和官方开放数据入口收集候选内容。

边界过滤：规则过滤和 Qwen 二次判别共同拦截医学、生物、材料、机械、纯自然地理等无关内容。

正式入库：通过审核的内容进入数据库，并自动进入“最新”页面。

归类落位：新内容进一步进入论文、数据集、项目、工具、资讯等对应目录。

后处理：补摘要、补中文标题与摘要、资讯全文翻译、重建集合分类、更新关键词画像和语义索引。

当前来源范围

论文源：arXiv、Nature 系列、Science、Taylor & Francis、GIS 与遥感核心期刊。

动态源：OpenAI、Google AI、Hugging Face、OGC、Digital Earth Africa 等官方博客。

数据源：NASA Earthdata、Microsoft Planetary Computer、Data.gov Geospatial 等官方开放入口。

内部源：实验室论文清单与团队研究方向关键词。

内容治理规则

系统主动排除化学、生物、地质、纯自然地理等与实验室方向不一致的内容。

材料、机械、工业制造、机器人控制、泛智能体 benchmark 等内容会被持续压制或排除，防止词面相似但方向错误的内容混入。

每轮刷新后都会回填摘要与中文翻译，并重建关键词画像、集合分类与语义索引，避免新内容只入库不入检索。

英文内容优先补中文标题与中文摘要，便于首页浏览、中文搜索与问答引用。

问答与搜索统一走混合召回，并保留可核验的来源网址。

部署与运行

当前采用本地部署，前端运行在 5021， API 运行在 5022。刷新、索引、搜索与问答都由统一后端服务管理。

研究日报归档

第073期 · 2026-06-19

最新页提供研究日报 PDF 下载，后续期数会按日期累积，形成可回看的历史归档。

下载当前期数

系统在线状态

API 服务

在线

数据库与任务链

正常

当前状态

空闲

今日内容生成

4/4 正常

邮件日报

已配置

API 启动：2026-05-24 12:47

最近完成：2026-06-19 20:18

本轮新增：4

翻译：已完成

索引：已完成

日报/发现/灵感/雷达：好 / 好 / 好 / 好

技术栈

Next.js 16

TypeScript

Tailwind CSS

shadcn/ui

FastAPI

SQLite

APScheduler

Qwen Flash

text-embedding-v4

Nextra

进入全局检索查看灵感页面打开知识工作台

系统架构

采集层

接入 arXiv、顶级期刊 RSS、官方博客、官方开放数据入口与实验室论文清单，构建高质量来源池。

处理层

完成去重、摘要补全、中文翻译、关键词画像、自适应扩词、数据集/项目/工具分类与日报生成。

索引层

SQLite 持久化结构化数据与 embedding，搜索和问答统一使用混合语义召回。

应用层

前端提供首页、搜索、问答、论文、数据集、项目、工具与关于页面，后端提供 API 与调度。

创新点

将论文、博客、开放资源与实验室论文放进同一条知识处理链路，而不是分散在多个静态页面。

刷新、搜索、问答共用同一套关键词画像与语义索引，减少“搜得到但答不准”的割裂现象。

支持实验室主题的自适应扩词，围绕 GeoAI、轨迹数据、时空知识图谱、地理大模型等方向持续扩展。

首页实验室日报每天生成一次，基于前一天内容提炼研究热点、开放资源与资讯亮点，而不是只展示统计数字。

最新页同步提供带期数的研究日报 PDF 下载，首期开始建立归档，后续期数持续保留历史入口。

灵感页面每天从知识库中提炼 2-3 个主题，用更接近导师抛题的方式生成研究问题，兼顾学术相关性与跨学科启发。

发现页面每天输出来源建议、关键词建议与扩展主题建议，帮助系统持续扩源，但不直接自动改动正式白名单。

技术框架

平台围绕采集、处理、组织、索引与应用五个环节闭环运行，搜索、问答、摘要和灵感并不是独立系统，而是共用同一套知识底座。

来源采集层

接入 arXiv、期刊 RSS、机构博客、官方开放数据入口与实验室论文清单，形成高质量来源池。

清洗处理层

执行去重、边界过滤、摘要补全、中文翻译、资源抽取与相关性判断，确保资料真正贴近实验室方向。

知识组织层

将内容统一写入结构化数据库，维护关键词画像、论文/数据集/项目/工具归类、日报卡片与灵感主题候选池。

索引服务层

构建关键词检索、语义索引与检索增强问答链路，支撑搜索、问答、摘要与灵感共用同一知识底座。

灵感模块

灵感不是开放问答，也不是随机 brainstorm，而是基于真实知识库资料生成的研究启发页，主要服务于研究生选题、方向比较与跨主题联想。

每天从知识库和关键词画像中选择 2-3 个主题，生成研究启发卡片。

每个主题只生成 5 个问题，固定包含问题、难点、路线、可能成果与支撑资料。

灵感允许跨学科联想，但必须最终落在 GIS、GeoAI、空间智能、城市计算等真实语境中。

主题选择会避开连续重复：最近 3 天出现过的主题会降权，并避免连续两天完全相同的组合。

实验室重点方向会进入保底轮换主题池，例如“城市感知、街景感知与空间优化”不会长期缺席，只是会在不同日期与其他高频主题交替出现。

系统流程图

从候选采集到知识库服务的主链路。

STEP 01

来源采集

论文、博客、官方开放数据入口与实验室论文进入统一候选池。

→

STEP 02

处理清洗

完成去重、相关性过滤、摘要补全、中文翻译与资源抽取。

→

STEP 03

索引生成

更新关键词画像、集合分类与语义向量；首页实验室日报按日生成，面向前一天内容做研究与资讯归纳。

→

STEP 04

前端服务

搜索、问答、论文页、数据集页与关于页共用同一知识底座。