实验室合照
关于平台

UrbanComp Lab | 学习资料库

面向 中国地质大学(武汉)位置智能与城市感知实验室 的正式研究资料平台。系统持续采集权威论文、机构博客、 开放资源与实验室论文,形成统一知识库,支持日级热点浏览、语义检索、 来源核验与智能问答。

实验室与平台

中国地质大学(武汉)位置智能与城市感知实验室

该系统不是普通导航页,而是实验室面向日常学习、科研跟踪、资料沉淀与专题观察的知识基础设施。 平台围绕 GeoAI、GIS、遥感、轨迹数据、城市交通、时空知识图谱、复杂网络、地理模拟、 多源多模态地理数据与地理大模型持续扩展。

系统功能

面向实验室日常学习、论文跟踪、资料沉淀、专题观察与研究启发。 用户可以在同一站点内完成检索、浏览、摘要查看、来源核验、知识追踪与灵感启发。

运行方式

当前采用本地部署。前端固定运行在 5021,API 固定运行在 5022, 内容刷新在固定时刻自动执行,研究日报 PDF 默认在每天 09:10 更新, 首页摘要与灵感在每天固定时间生成, 抓取、翻译、归类、索引、摘要与问答统一由后端任务链管理。

功能结构

平台不是单页展示,而是由总览、最新流、资讯流、论文/数据集/项目/工具专题页、灵感页和内部问答组成的完整知识系统。

首页

展示搜索入口、今日摘要、灵感预览、更新状态与访问统计,是整站的总览与快速进入页。

最新

按入库时间展示最新进入资料库的内容,并提供带期数的研究日报 PDF 下载与历史归档入口。

研究日报

围绕实验室五个研究方向生成可下载 PDF,今天作为第 001 期建立归档,后续在每天 09:10 持续更新。

资讯

聚合机构博客、平台动态、智慧城市、规划设计与地图平台更新,支持正文抓取与中文翻译。

论文 / 数据集 / 项目 / 工具

论文和数据集卡口更严格;项目和工具基于资源抽取与主题信号归类落位。

灵感

每天围绕真实知识库条目生成 2-3 个主题,每个主题给出 5 个研究问题、难点、路线与可能成果。

发现

每天输出来源建议、关键词建议与扩展主题建议,作为扩源与补抓的公开参考页,不直接自动改主配置。

问答

内部权限页面,面向实验室成员提供带来源引用的连续问答,不对外开放公开互动。

实验室名称
中国地质大学(武汉)位置智能与城市感知实验室
实验室主页
urbancomp.net
统一知识入口

论文、资讯、数据集、项目、工具与团队论文进入同一资料库,支持跨来源检索、聚合浏览与站内详情查看。

结构化情报处理

系统自动整理标题、摘要、作者、标签、资源链接、来源网址、中文翻译、正文与摘要卡片。

语义检索与问答

搜索与问答共用混合语义检索链路,支持主题召回、连续追问与来源核验。

研究启发生成

灵感页面每天围绕真实知识库资料生成研究问题、难点、路线与可能成果,并为实验室重点方向保留轮换主题,服务于研究生选题和方向启发。

发现与扩源

发现页面结合 Brave 搜索与知识库分析,给出来源建议、关键词建议和主题扩展建议,帮助系统持续补充高质量内容。

定时增量更新

系统按固定频次自动刷新资料、翻译新内容、更新语义索引,并在每天 09:10 生成可下载的研究日报 PDF 归档。

自动更新机制

资料刷新、灵感生成、实验室日报和首页热词共用同一套后台调度链路。用户前台看到的是结果,不暴露内部控制项。

最近完成:2026-05-05 08:16
资料抓取
每天 12 次

抓取论文、资讯、官方开放数据与团队相关资源,随后执行过滤、翻译、归类与索引。

研究雷达
每天 2 次

按研究方向提炼趋势摘要、趋势信号与核心观点,作为 /latest 页的主视图。

灵感卡片
每天 1 次

每天早上生成研究启发卡片,基于真实知识库资料组织问题、难点、路线与可能成果。

发现建议
每天 1 次

每天生成来源建议、关键词建议与扩展主题建议,用于后续扩源与补抓,并将高质量建议注入下一轮发现流程。

研究日报 PDF
每天 08:55

每天 09:10 发布带期数的研究日报 PDF,并在最新页持续保留历史下载入口。

首页热词
每小时轮换

从知识库与关键词画像中选择当前时段值得关注的主题词,只保留有真实资料支撑的方向。

新增内容如何进入站内

新增内容不会“抓到即展示”。所有内容都要先通过实验室研究边界,再经过翻译、摘要、归类和索引处理,最后进入相应页面。

抓取候选:从 arXiv、期刊 RSS、机构资讯和官方开放数据入口收集候选内容。
边界过滤:规则过滤和 Qwen 二次判别共同拦截医学、生物、材料、机械、纯自然地理等无关内容。
正式入库:通过审核的内容进入数据库,并自动进入“最新”页面。
归类落位:新内容进一步进入论文、数据集、项目、工具、资讯等对应目录。
后处理:补摘要、补中文标题与摘要、资讯全文翻译、重建集合分类、更新关键词画像和语义索引。
当前来源范围

论文源:arXiv、Nature 系列、Science、Taylor & Francis、GIS 与遥感核心期刊。

动态源:OpenAI、Google AI、Hugging Face、OGC、Digital Earth Africa 等官方博客。

数据源:NASA Earthdata、Microsoft Planetary Computer、Data.gov Geospatial 等官方开放入口。

内部源:实验室论文清单与团队研究方向关键词。

内容治理规则

系统主动排除化学、生物、地质、纯自然地理等与实验室方向不一致的内容。

材料、机械、工业制造、机器人控制、泛智能体 benchmark 等内容会被持续压制或排除,防止词面相似但方向错误的内容混入。

每轮刷新后都会回填摘要与中文翻译,并重建关键词画像、集合分类与语义索引,避免新内容只入库不入检索。

英文内容优先补中文标题与中文摘要,便于首页浏览、中文搜索与问答引用。

问答与搜索统一走混合召回,并保留可核验的来源网址。

部署与运行

当前采用本地部署,前端运行在 5021, API 运行在 5022。 刷新、索引、搜索与问答都由统一后端服务管理。

研究日报归档
第029期 · 2026-05-05

最新页提供研究日报 PDF 下载,后续期数会按日期累积,形成可回看的历史归档。

下载当前期数
系统在线状态
API 服务
在线
数据库与任务链
正常
当前状态
空闲
今日内容生成
4/4 正常
邮件日报
已配置
API 启动:2026-04-29 12:53
最近完成:2026-05-05 16:16
本轮新增:3
翻译:已完成
索引:已完成
日报/发现/灵感/雷达:好 / 好 / 好 / 好
技术栈
Next.js 16
TypeScript
Tailwind CSS
shadcn/ui
FastAPI
SQLite
APScheduler
Qwen Flash
text-embedding-v4
Nextra
系统架构
采集层

接入 arXiv、顶级期刊 RSS、官方博客、官方开放数据入口与实验室论文清单,构建高质量来源池。

处理层

完成去重、摘要补全、中文翻译、关键词画像、自适应扩词、数据集/项目/工具分类与日报生成。

索引层

SQLite 持久化结构化数据与 embedding,搜索和问答统一使用混合语义召回。

应用层

前端提供首页、搜索、问答、论文、数据集、项目、工具与关于页面,后端提供 API 与调度。

创新点

将论文、博客、开放资源与实验室论文放进同一条知识处理链路,而不是分散在多个静态页面。

刷新、搜索、问答共用同一套关键词画像与语义索引,减少“搜得到但答不准”的割裂现象。

支持实验室主题的自适应扩词,围绕 GeoAI、轨迹数据、时空知识图谱、地理大模型等方向持续扩展。

首页实验室日报每天生成一次,基于前一天内容提炼研究热点、开放资源与资讯亮点,而不是只展示统计数字。

最新页同步提供带期数的研究日报 PDF 下载,首期开始建立归档,后续期数持续保留历史入口。

灵感页面每天从知识库中提炼 2-3 个主题,用更接近导师抛题的方式生成研究问题,兼顾学术相关性与跨学科启发。

发现页面每天输出来源建议、关键词建议与扩展主题建议,帮助系统持续扩源,但不直接自动改动正式白名单。

技术框架

平台围绕采集、处理、组织、索引与应用五个环节闭环运行,搜索、问答、摘要和灵感并不是独立系统,而是共用同一套知识底座。

来源采集层

接入 arXiv、期刊 RSS、机构博客、官方开放数据入口与实验室论文清单,形成高质量来源池。

清洗处理层

执行去重、边界过滤、摘要补全、中文翻译、资源抽取与相关性判断,确保资料真正贴近实验室方向。

知识组织层

将内容统一写入结构化数据库,维护关键词画像、论文/数据集/项目/工具归类、日报卡片与灵感主题候选池。

索引服务层

构建关键词检索、语义索引与检索增强问答链路,支撑搜索、问答、摘要与灵感共用同一知识底座。

灵感模块

灵感不是开放问答,也不是随机 brainstorm,而是基于真实知识库资料生成的研究启发页,主要服务于研究生选题、方向比较与跨主题联想。

每天从知识库和关键词画像中选择 2-3 个主题,生成研究启发卡片。

每个主题只生成 5 个问题,固定包含问题、难点、路线、可能成果与支撑资料。

灵感允许跨学科联想,但必须最终落在 GIS、GeoAI、空间智能、城市计算等真实语境中。

主题选择会避开连续重复:最近 3 天出现过的主题会降权,并避免连续两天完全相同的组合。

实验室重点方向会进入保底轮换主题池,例如“城市感知、街景感知与空间优化”不会长期缺席,只是会在不同日期与其他高频主题交替出现。

系统流程图

从候选采集到知识库服务的主链路。

STEP 01
来源采集

论文、博客、官方开放数据入口与实验室论文进入统一候选池。

STEP 02
处理清洗

完成去重、相关性过滤、摘要补全、中文翻译与资源抽取。

STEP 03
索引生成

更新关键词画像、集合分类与语义向量;首页实验室日报按日生成,面向前一天内容做研究与资讯归纳。

STEP 04
前端服务

搜索、问答、论文页、数据集页与关于页共用同一知识底座。