Recognizing Building Group Patterns in Topographic Maps by Integrating Building Functional and Geometric Information
TL;DR 精炼摘要
提出将建筑功能与几何信息融合的建筑群识别方法,利用腾讯用户密度和兴趣点数据推断建筑功能,结合约束德劳内三角剖分提取空间指标,通过图分割实现建筑群提取。方法在案例中正确率超81%,显著优于仅基于几何特征的方法,提升地图综合的空间划分准确性。
摘要
Citation: He, X.; Deng, M.; Luo, G. Recognizing Building Group Patterns in Topographic Maps by Integrating Building Functional and Geometric Information. ISPRS Int. J. Geo-Inf. 2022 , 11 , 332. https://doi.org/ 10.3390/ijgi11060332 Academic Editors: Florian Hruby and Wolfgang Kainz Received: 1 April 2022 Accepted: 31 May 2022 Published: 1 June 2022 Publisher’s Note: MDPI stays neutral with regard to jurisdictional claims in published maps and institutional affil- iations. Copyright: © 2022 by the authors. Licensee MDPI, Basel, Switzerland. This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license (https:// creativecommons.org/licenses/by/ 4.0/). International Journal of Geo-Information Article Recognizing Building Group Patterns in Topographic Maps by Integrating Building Functional and Geometric Information Xianjin He 1,2 , Min Deng 1, * and Guowei Luo 2 1 School of Geosciences and Info-Physics, Central South University, Changsha 410083, China; xjhe9@nnnu.edu.cn 2 Key Laboratory of Environment Change and Resources Use in Beibu Gulf, Ministry of Education, Nannin
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
识别地形图中的建筑群模式:整合建筑功能与几何信息 (Recognizing Building Group Patterns in Topographic Maps by Integrating Building Functional and Geometric Information)
1.2. 作者
- Xianjin He (何献金)
- Min Deng (邓敏)
- Guowei Luo (罗国伟)
1.3. 发表期刊/会议
ISPRS International Journal of Geo-Information (ISPRS Int. J. Geo-Inf.)。该期刊是国际摄影测量与遥感学会 (ISPRS) 旗下的一个开放获取期刊,专注于地理信息科学领域,涵盖遥感、摄影测量、地理信息系统等方面,在地理空间信息领域具有一定的学术影响力。
1.4. 发表年份
2022年
1.5. 摘要
识别建筑群模式是城市景观评估、社会分析和地图综合 (map generalization) 等众多领域的基础。尽管目前有越来越多的建筑群模式识别算法,但由于信息不足以及识别方法仅提供几何特征,导致分组结果仍不尽如人意。本研究旨在提供一种结合建筑功能和几何信息的新型建筑分组方法。我们特别关注地形图中建筑群的识别过程,作为后续地图综合的先决条件。首先,基于腾讯用户密度数据和兴趣点 (POIs) 数据,使用动态时间规整 (DTW) 算法推断建筑功能。然后,为每个建筑块创建两种受约束的德劳内三角剖分 (CDTs),从中导出若干空间指标,如连续性指数 (SCI)、每两个相邻建筑的方向和距离。最后,在导出的矩阵和建筑功能信息的基础上,将每个建筑块建模为图 (graph),并提出一种图分割 (graph segmentation) 方法来提取建筑群。通过案例研究对所提出的方法进行了测试。实验结果表明,该方法能够产生令人满意的结果,研究区域的正确率 (correctness value) 达到81.63%以上。对比研究显示,当不同功能的建筑彼此靠近时,不含建筑功能信息的方法是无效的分组方法。此外,从本方法得出的综合结果与日常使用的地图更吻合,因为它们为用户提供了更准确的城市建筑空间划分。
1.6. 原文链接
/files/papers/691086c75d12d02a6339cf06/paper.pdf
2. 整体概括
2.1. 研究背景与动机
- 核心问题: 建筑群模式识别是地理信息科学中的一个基本问题,但现有方法在识别建筑群模式时仍面临挑战,尤其是在地图综合 (map generalization) 的背景下。
- 重要性: 建筑群模式识别对于城市景观评估、社会分析和地图综合至关重要。在地图综合中,它提供结构信息,有助于选择和参数化地图综合算子。
- 现有挑战或空白 (Gap):
- 信息不足: 大多数现有算法仅考虑建筑的几何信息(如大小、距离、方向、形状、面积、方位等),而忽视了建筑的语义信息,特别是建筑功能 (building function)。
- 结果不满意: 仅依赖几何特征导致识别结果与人工识别存在较大差异,无法满足实际应用需求,特别是在地图综合中无法提供合理、准确的空间划分。
- 大数据的机遇: 随着地理空间大数据(如 POIs、社交媒体数据、GPS轨迹数据)的兴起,通过整合多源数据推断建筑功能成为可能,这为解决上述问题提供了新的机会。
- 切入点或创新思路: 本文旨在通过结合建筑功能信息和几何特征来改进建筑群模式识别方法,以期获得更准确和合理的分组结果,并将其应用于地图综合。
2.2. 核心贡献/主要发现
- 主要贡献:
- 提出结合功能与几何信息的方法: 提出了一种新颖的建筑群识别方法,首次将建筑功能信息与几何特征整合起来,克服了传统方法仅依赖几何信息导致的问题。
- 利用大数据推断建筑功能: 引入了腾讯用户密度数据和兴趣点 (POIs) 数据,并结合动态时间规整 (DTW) 算法来推断建筑功能,为建筑群识别提供了重要的语义约束。
- 基于图分割的识别框架: 为每个建筑块构建了图模型,并基于两种受约束的德劳内三角剖分 (CDTs) 导出了多项空间指标,然后提出了一种图分割方法来提取建筑群。
- 应用于地图综合: 证明了该方法识别出的建筑群模式能够为后续的地图综合提供更符合日常使用地图的、更准确的城市建筑空间划分。
- 关键结论或发现:
- 功能信息的重要性: 实验结果表明,整合建筑功能信息显著提高了建筑群识别的准确性和合理性,正确率 (correctness value) 超过81.63%。
- 对比优势: 与不考虑建筑功能信息的标准 CTD 方法相比,本方法在处理功能不同但空间相邻的建筑群时表现出明显优势,避免了错误的合并分组(欠分割)。
- 对地图综合的积极影响: 基于本方法识别的建筑群进行的地图综合结果,能提供更符合用户认知和导航需求的城市空间划分。
3. 预备知识与相关工作
3.1. 基础概念
- 建筑群模式识别 (Building Group Pattern Recognition): 指在地图空间中,根据建筑物的空间分布特征(如大小、距离、方向)和语义特征(如功能)将相关的建筑物组织成具有特定结构或意义的集合的过程。它旨在揭示建筑物之间隐藏的空间关系和组织结构。
- 地图综合 (Map Generalization): 这是一个在制图中将大比例尺地图(包含更多细节)转换为小比例尺地图(包含更少细节但保持主要地理特征和可读性)的过程。它涉及选择、简化、平滑、聚合、位移和强化等操作,以解决实体间的空间冲突。建筑群模式识别是地图综合的先决条件,因为了解建筑物如何形成群组有助于更合理地进行综合操作。
- 受约束的德劳内三角剖分 (Constrained Delaunay Triangulation, CDT): 是一种特殊的德劳内三角剖分,其中指定的边(约束边)在三角剖分结果中必须存在。在本文中,CDT 用于建模建筑物之间的邻近关系,约束边可以代表道路或建筑物的边界。它能够有效地捕捉空间对象的邻近性和拓扑关系。
- 动态时间规整 (Dynamic Time Warping, DTW): 是一种用于测量两个时间序列之间相似度的算法,即使它们在时间轴上存在非线性扭曲(即一个序列相对于另一个序列可能加速或减速)。DTW 通过找到一个最优的“规整路径”来最小化两个序列之间的距离,从而在处理不同长度或不同速度的时间序列时表现出鲁棒性。在本文中,DTW 用于比较不同建筑物的时间序列用户密度曲线,以推断其功能。
- 兴趣点 (Points of Interest, POIs): 指地理空间中具有特定功能或服务的重要地点,例如餐馆、商店、学校、医院、公园等。POIs 携带着丰富的语义信息,常用于城市功能区识别、建筑功能推断等。
- 腾讯用户密度数据 (Tencent User Density Data): 来源于腾讯LBS(Location-Based Service,基于位置服务)产品的用户位置信息。这些数据反映了特定区域在不同时间段内的人口活动强度,可以作为推断建筑或区域功能的重要依据。例如,商业区在白天和夜晚的用户密度变化模式与住宅区不同。
- 图分割 (Graph Segmentation): 是一种将图划分为多个子图或群组的方法,使得同一子图内的节点之间连接紧密或具有相似特征,而不同子图的节点之间连接稀疏或具有不同特征。在本文中,建筑物被视为图的节点,它们之间的空间关系和功能相似性被编码为边的权重,图分割的目标是识别出具有相似特征的建筑群。
3.2. 前人工作
- 传统建筑群识别方法: 传统的建筑群识别方法主要集中在几何特征上,大致可分为两类:
- 聚类方法 (Clustering Methods): 这类方法通过比较相邻建筑物之间的空间关系来形成潜在模式。它们通常使用图来建模建筑物及其邻近关系,其中节点代表建筑物,边代表建筑物之间的邻近关系,边的权重则反映空间相似性。常见的相似性度量包括欧氏距离(最近距离、平均距离、可见距离)[12-14],以及建筑物的形状、面积和方向等属性[15-18]。受约束的德劳内三角剖分 (CDT) [10,11]是构建这种图模型常用的技术。
- 模板匹配方法 (Template Matching Methods): 这类方法通过预定义模板来识别特定类型的群组模式。首先定义模板参数,然后确定潜在的群组模式,最后比较两者是否匹配。识别的模式包括中心线对齐模式[5]、线性对齐模式[19]和道路对齐模式[20]。
- 机器学习方法: 除了图分割方法[16]外,机器学习方法如卷积神经网络 (Convolutional Neural Networks, CNN)[21]、随机森林 (Random Forest)[22]和支持向量机 (Support Vector Machine, SVM)[23]也用于建筑群识别。
- 地理空间大数据与建筑功能: 随着地理空间大数据的兴起,利用多源数据(如 POIs、社交媒体、GPS 轨迹数据)推断城市结构和建筑功能成为新趋势[24]。
- 研究尺度: 建筑功能研究主要集中在建筑街区/社区层面[25,26]和单个建筑层面[27,28]。然而,作者指出这些尺度在日常地图使用中可能过大或过小,无法提供准确的建筑场景理解,且未考虑建筑几何信息,缺乏模式信息。
3.3. 技术演进
该领域的技术演进主要体现在从单一几何特征到多源信息融合,以及从传统算法到机器学习方法的演变:
- 早期: 专注于建筑物的基本几何属性(距离、方向、大小、形状)进行聚类或模板匹配。
- 中期: 引入更复杂的几何关系建模(如 CDT)和图理论,提高了对空间邻近和连接的描述能力。机器学习方法开始被探索。
- 近期(本文所在阶段): 随着地理空间大数据的爆炸式增长,研究开始转向整合语义信息(如建筑功能)。本文正是这一趋势的体现,通过结合腾讯用户密度数据和 POIs 推断建筑功能,并将功能信息与几何特征结合,以期实现更准确、更符合认知的建筑群识别。
3.4. 差异化分析
本文方法与相关工作中的主要方法的核心区别和创新点在于:
- 整合语义信息: 绝大多数现有方法仅考虑建筑的几何信息。本文通过利用腾讯用户密度数据和 POIs 推断建筑功能,首次将建筑功能这一重要的语义信息整合到建筑群识别过程中,作为识别的强约束。
- 更符合实际的分组逻辑: 传统方法若仅考虑几何邻近性,可能将功能完全不同的但物理上靠近的建筑物(例如,商业建筑旁边的住宅楼)错误地分到同一组。本文通过功能约束,确保只有具有相同功能的相邻建筑物才可能被分到同一组,这使得分组结果更符合城市规划和人类活动的实际逻辑。
- 对地图综合的实用性提升: 传统的几何分组在进行地图综合时可能产生不合理的结果。本文方法的分组能更好地反映城市功能区的划分,因此其综合结果更符合日常地图用户的认知和导航需求。
4. 方法论
本文提出的方法论旨在通过结合建筑功能和几何信息来识别地形图中的建筑群模式。整个过程可以分为两大主要步骤:建筑功能推断和建筑群识别。下面将详细描述这些步骤,并融入相关的数学公式。
4.1. 方法原理
该方法的核心思想是,具有相似功能且在空间上相互接近的建筑物更可能属于同一个建筑群。首先,利用时间序列的用户密度数据推断每个建筑的功能,为后续分组提供语义层面的约束。然后,基于受约束的德劳内三角剖分 (CDT) 建立建筑物之间的几何邻近关系和空间指标。最后,将每个建筑块建模为图,并结合功能信息和几何指标,通过图分割算法识别出最终的建筑群。
4.2. 核心方法详解
本文的方法论包含一系列步骤,如原文表格 Table 1 所示,我们将逐一进行详细阐述。
以下是原文 Table 1 的结果:
| Main Steps | Detailed Description |
| Infer building functions | Map user density distributions using kernel density tool |
| Step 1 | Select building samples and compute their average user density |
| Step 2 Step 3 | |
| Infer building functions using the dynamic time warping (DTW) algorithm | |
| Recognition of building groups | |
| Step 4 | Create constrained Delaunay triangulation for each building block |
| Step 5 | Compute index values based on constrained Delaunay triangulation |
| Step 6 | Graph creation and segmentation |
| Assessment | |
| Step 7 | Accuracy assessment with reference data |
4.2.1. 推断建筑功能 (Infer Building Functions)
这一部分主要负责从地理空间大数据中提取建筑物的语义信息,即其功能类型。
-
步骤 1:绘制用户密度分布图 (Map User Density Distributions)
- 描述: 首先,使用腾讯用户密度数据绘制用户密度分布图。原始数据是带有用户计数的点状 shapefile。为了处理异常数据(某些点用户计数异常高),需要手动移除这些异常点。然后,使用
ArcMap的核密度 (kernel density) 工具为每个时间点生成用户密度分布图。这反映了不同时间点,不同区域的人口活跃度。
- 描述: 首先,使用腾讯用户密度数据绘制用户密度分布图。原始数据是带有用户计数的点状 shapefile。为了处理异常数据(某些点用户计数异常高),需要手动移除这些异常点。然后,使用
-
步骤 2:选择样本并计算平均用户密度 (Select Building Samples and Compute Their Average User Density)
-
描述: 在这一步中,研究者需要获取研究区域内建筑物的真实功能信息作为样本。通过 Baidu Maps 的兴趣点 (POIs) 和街景数据,以及 Google Earth 和实地调查,确定了建筑物的类型,例如住宅、办公和商业建筑。然后,为每种类型的建筑物选择代表性样本,并计算它们的平均用户密度。这个过程通过以下公式实现:
- 符号解释:
D _ { k , w }:表示在特定星期 (工作日或非工作日)内, 类型建筑的平均用户密度。- :表示建筑功能类型(例如,住宅、办公、商业)。
m _ { k }:表示第 种功能类型建筑的样本数量。N _ { k , w }:表示第 种功能类型建筑的第 个样本的用户密度。这里的N _ { k , w }实际上代表了一个时间序列,即在一天24小时内每个时刻的用户密度值。- : 表示一天中的时间点,范围从0到24小时。
- :表示对所有
m _ { k }个样本建筑在每个时间点 的用户密度值进行求和。
- 目的分析: 这个公式旨在获得每种功能类型建筑(如住宅、办公、商业)在一天24小时内,工作日或非工作日的用户活动模式(即用户密度的时间序列曲线)。
- 符号解释:
-
-
步骤 3:使用动态时间规整 (DTW) 算法推断建筑功能 (Infer Building Functions Using the Dynamic Time Warping (DTW) Algorithm)
- 描述: 获得了每种建筑功能类型的活动峰值曲线(在步骤2中计算得到)后,对于待预测功能的建筑物,我们将其用户密度时间序列与这些标准样本曲线进行比较。动态时间规整 (DTW) 算法[30]被用于测量两个时间序列之间的相似度。
- DTW 原理: DTW 假设如果两个序列的点能够正确对应,那么它们之间的距离(欧氏距离)将最小化。这个最小距离被视为两个序列的相似度。
- 应用:
- 将样本(例如,住宅、办公、商业)的平均用户密度时间序列作为标准参考模板 。 是一个 M 维向量,表示为 ,其中每个分量 代表特定时间点的平均用户密度值。
- 将每个待预测建筑物的平均用户密度序列作为测试模板 ,它可能是一个 N 维向量,表示为 。
- DTW 算法用于比较每个待预测建筑物的序列与每种样本类型(住宅、办公、商业)的序列。待预测建筑物的功能由与其 DTW 距离最小的样本类型决定。
4.2.2. 识别建筑群 (Recognition of Building Groups)
这一部分主要负责利用建筑的几何特征和已推断的功能信息来识别建筑群。
-
步骤 4:为每个建筑块创建受约束的德劳内三角剖分 (Create Constrained Delaunay Triangulation for Each Building Block)
- 描述:
-
分区: 为了提高处理效率,首先利用道路网络将地形图上的建筑物划分为一系列独立的建筑块 (building blocks)。每个建筑块被视为一个独立的分析单元。
-
创建 CDT: 为每个建筑块创建两种类型的受约束德劳内三角剖分 (CDT)。
- 第一种 CDT: 针对每个建筑块内的所有建筑物进行计算 (如原文 Figure 2a 所示)。这种 CDT 用于检测建筑物之间的邻接关系。如果两个建筑物在 CDT 中有共享的三角形,则认为它们是邻接的。
- 第二种 CDT (成对建筑三角形): 仅针对每一对相邻建筑物进行计算 (如原文 Figure 2b 所示)。这种 CDT 用于派生具体的空间指标。
-
预处理: 在创建 CDT 之前,在建筑物多边形和道路的线段上以一定间隔添加额外的点,以避免产生狭长的三角形[31],从而提高三角剖分的质量。
以下是原文 Figure 2 的结果:
该图像是图3,示意了相邻建筑的高度及其骨架线。图中用虚线表示骨架线,灰色区域代表建筑及其编号,黄色三角形表示网格三角形,并标注了相关高度hi和区域L6,7。
-
- 描述:
-
步骤 5:基于受约束的德劳内三角剖分计算指标值 (Compute Index Values Based on Constrained Delaunay Triangulation)
- 描述: 基于上述两种 CDT,计算相邻建筑物之间的多种空间指标。这些指标(除了路径角)存储在矩阵中,用于后续的图构建和分割。
-
邻近关系矩阵 (Proximity Relationship Matrix):
- 描述: 该矩阵表示建筑物之间是否存在拓扑邻接关系。它是根据建筑物是否在 CDT 中共享三角形来导出的。
- 公式:
- 符号解释:
- : 邻近关系矩阵。
- 和 : 表示建筑块内的建筑物索引, 是建筑块内的建筑物总数。
R _ { i , j }: 是一个布尔变量。- : 表示建筑物 和 之间是邻接的。
- : 表示建筑物 和 之间不邻接。
- 符号解释:
- 目的分析: 这个矩阵用于确定哪些建筑物之间存在直接的空间联系,从而为构建图提供边的基础。
-
骨架线长度 (Length of the Skeleton Line):
-
描述: 骨架线由连接两个相邻建筑物三角形边的中点形成 (如原文 Figure 3 所示)。
-
公式:
- 符号解释:
- : 骨架线长度矩阵。
L _ { i , j }: 表示建筑物 和 之间骨架线的总长度。l _ { i , j , k }: 表示连接两个相邻建筑物 和 的三角形 的两条边中点之间的距离。- : 求和符号,表示将连接建筑物 和 的所有相关三角形的
l _ { i , j , k }值相加。 - 如果建筑物 和 不邻接(根据 ),则 。
- 符号解释:
-
目的分析: 骨架线长度可以量化两个相邻建筑物之间共享的边界或连接区域的程度。
以下是原文 Figure 3 的结果:
该图像是示意图,展示了图4中邻接建筑方位角的计算过程,分别表示(a)所有三角形的方位角,(b)两个相邻建筑的平均方位角,(c)两个相邻建筑的最终方位角。
-
-
相邻建筑的平均距离 (Mean Distance of Adjacent Buildings):
- 描述: 基于骨架线计算相邻建筑的平均距离[13]。
- 公式:
- 符号解释:
- : 平均距离矩阵。
D _ { i , j }: 表示建筑物 和 之间的平均距离。h _ { i , j , k }: 表示三角形 的高,其底边落在相邻建筑物多边形中的一个。- 如果三角形是锐角或直角,
h _ { i , j , k }是从与建筑物共享的边算起的高度。 - 如果三角形是钝角,
h _ { i , j , k }是连接两个建筑物的三角形的最短边。
- 如果三角形是锐角或直角,
l _ { i , j , k }: 表示连接两个相邻建筑物 和 的三角形 的两条边中点之间的距离(同公式 (3))。- : 三角形高与骨架线段长度乘积的加权和。
- : 骨架线段长度的总和。
- 如果建筑物 和 不邻接(根据 ),则 。
- 符号解释:
- 目的分析: 这个加权平均距离更精确地反映了两个相邻建筑物之间的实际空间间隔。
-
空间连续性指数 (Spatial Continuity Index, SCI):
- 描述: 相邻建筑物之间 SCI 是骨架线长度与距离的比率。
- 公式:
- 符号解释:
S C I: 空间连续性指数矩阵。S C I _ { i , j }: 表示建筑物 和 之间的空间连续性。L _ { i , j }: 建筑物 和 之间骨架线的长度(同公式 (3))。D _ { i , j }: 建筑物 和 之间的距离(同公式 (4))。
- 符号解释:
- 目的分析: SCI 量化了两个建筑物在空间上的“连接程度”或“对齐程度”。较高的 SCI 值可能表示建筑物在视觉或功能上更倾向于形成一个连续的群组。
-
相邻建筑物的方位角 (Azimuth Angles of Two Adjacent Buildings):
-
描述: 基于两种受约束的德劳内三角剖分导出。计算过程包含三个步骤[15]:
- 计算所有三角形的方位角 (如原文 Figure 4a)。
- 计算两个相邻建筑物的平均方位角 (如原文 Figure 4b)。
- 确定两个相邻建筑物的最终方位角 (如原文 Figure 4c)。
-
目的分析: 方位角用于描述建筑物之间的相对方向,这对于识别线性排列模式至关重要。
以下是原文 Figure 4 的结果:
该图像是论文中图5的示意图,展示了(a)提出方法、(b)标准CTD方法与(c)参考地图对建筑群识别结果的对比。蓝色斜线区域表示正确分组,红色斜线区域表示与参考地图不一致的分组。
-
-
路径角 (Path Angle):
- 描述: 路径角是在路径中的中间建筑物 处,由建筑物方向 和建筑物方向 形成的夹角。
- 公式:
- 符号解释:
- : 路径角。
- : 建筑物 和 之间的路径角。
- : 三角形 的方位角,其底边落在相邻建筑物之一。
l _ { i , j , k }: 连接两个相邻建筑物 和 的三角形 的两条边中点之间的距离(同公式 (4))。- : 三角形方位角与骨架线段长度乘积的加权和。
- : 骨架线段长度的总和。
- 符号解释:
- 目的分析: 路径角越接近0,线性模式越好。它用于评估建筑物排列的线性程度,有助于识别线性的建筑群。
-
步骤 6:图创建与分割 (Graph Creation and Segmentation)
- 描述: 这是识别建筑群的核心步骤。
- 图创建:
- 节点与边: 将每个建筑块建模为一个图。图中的节点 (nodes) 代表建筑物。图中的边 (edges) 代表两个相邻建筑物之间的关系。
- 功能约束: 只有具有相同功能类型的相邻建筑物之间才能创建边。 这是本方法区别于传统方法的关键点。
- 权重: 边的权重由步骤5中导出的空间指标值(如距离、SCI、方位角等)决定。
- 图分割:
- 识别线性模式: 首先,由于线性模式具有高度同质性,因此优先识别。基于 SCI 和方位角,采用文献[15]中提出的方法来识别线性模式。
- 移除异常距离的边: 在线性模式识别后,通过迭代移除具有异常距离的边来进一步细化建筑群。具体步骤如下:
- 查找最短距离边: 确定连接一对节点(建筑物)且权重为最小距离的边。
- 查找邻居节点: 找到这对节点的所有邻居节点。
- 计算距离标准差: 计算这些邻居节点之间距离的标准差。
- 判断与删除: 如果标准差超过预设的阈值(例如 0.2),则删除具有最大距离的边。然后重新计算标准差,并重复判断和删除过程,直到标准差低于阈值或不再有边被删除。
- 迭代: 完成上述过程后,找到次短距离的边,并重复相同的操作。这个过程持续进行,直到所有不符合要求的边都被删除。
- 目的分析: 通过图创建和分割,将具有相似功能、紧密邻近且在几何上形成特定模式(如线性)的建筑物分组在一起。移除异常距离的边有助于消除离群值,使群组内部的同质性更高。
4.2.3. 评估 (Assessment)
- 步骤 7:使用参考数据进行准确性评估 (Accuracy Assessment with Reference Data)
- 描述: 为了评估所提出方法的有效性,进行了专家评估。将所识别的结果与专家手动识别的参考数据进行比较。这种比较方法在模式识别研究中被广泛使用[22,32]。
- 建筑功能评估: 对于使用 DTW 算法检测的建筑功能,通过与 Baidu Map POIs 进行比较来评估其准确性。
- 建筑群识别评估: 评估建筑群识别结果的参考数据是基于 Baidu Maps 和 Google Earth 图像手动识别的。
- 四种情况: 在评估建筑群识别结果时,可能出现四种情况:
- 正确模式 (Correct Patterns): 建模的模式与参考模式一致。
- 包含模式 (Inclusion Patterns): 一个建模模式包含了多个参考模式(即欠分割 under-segmentation)。
- 被包含模式 (Within Patterns): 一个参考模式包含了多个建模模式(即过分割 over-segmentation)。
- 重叠模式 (Overlap Patterns): 建模模式与参考模式之间存在重叠。
- 评估指标: 采用两个指标来评估模式识别结果的准确性:
- 正确率 (Correctness):
- 概念定义: 指正确识别的模式数量占总提取模式数量的比例。它衡量了识别结果中“真阳性”的比例,即模型识别出的群组中有多少是真正正确的。
- 数学公式:
- 符号解释:
- : 正确识别的建筑群模式数量。
- : 模型识别出的总建筑群模式数量。
- 完整率 (Completeness):
- 概念定义: 指正确识别的模式数量占总参考模式数量的比例。它衡量了模型识别出多少“真阳性”模式,即模型能够覆盖多少实际存在的正确群组。
- 数学公式:
- 符号解释:
- : 正确识别的建筑群模式数量。
- : 参考数据中存在的总建筑群模式数量。
- 正确率 (Correctness):
- 对比方法: 为了理解所提出方法的鲁棒性,还使用了一种不包含建筑功能识别的方法(即标准 CTD 方法)进行对比实验。该方法仅执行
Table 1中的步骤4到步骤6,即仅使用 CTD 计算相邻建筑的指标值,而在图创建阶段,无论功能如何,只要相邻就创建边。
5. 实验设置
5.1. 数据集
- 研究区域: 中国四川省成都市。成都市是中国西南部最大的城市。
- 研究材料:
-
建筑物足迹数据 (Building Footprints): 包含546栋建筑物的 ESRI shapefile 格式数据。这些数据由四川省城市规划设计勘察研究院提供。
-
道路网络数据 (Road Networks): 由四川省城市规划设计勘察研究院提供,用于将建筑物划分为不同的建筑块。
-
实时腾讯用户密度 (Real-time Tencent User Density, RTUD): 记录了使用腾讯产品(如腾讯QQ、微信、腾讯地图等提供基于位置服务 (LBS) 的移动应用程序)的智能终端设备的位置信息。通过网络爬虫每两小时从腾讯网站 (http://ur.tencent.com) 捕获这些数据(访问日期:2020年6月5日)。为了区分工作日和非工作日的活动差异,选择了2020年6月5日(工作日)和2020年6月6日(非工作日)的 RTUD 数据来推断建筑功能。
-
验证数据: 利用 Baidu Maps 和 Google Earth 图像来验证实验结果。
-
地图综合对比数据: 从高德地图 (AutoNavi map) 下载的道路网络数据,用于讨论地图综合结果。高德地图是日常生活中广泛用于驾驶导航的电子地图。
以下是原文 Figure 1 的结果:
该图像是论文中的示意图,展示了研究区的位置及实验数据,包括(a)中国四川省地图,(b)四川省省会成都市地图,以及(c)成都市详细的建筑物测试数据分布情况。
-
5.2. 评估指标
论文中使用了 correctness 和 completeness 这两个指标来评估建筑群模式识别结果。
-
正确率 (Correctness)
- 概念定义: 正确率衡量的是模型识别出的所有建筑群模式中,有多少是与参考数据完全一致的“正确”模式。它关注的是模型识别结果的准确性,即模型没有产生太多错误的群组。
- 数学公式:
- 符号解释:
- :指被模型正确识别出的建筑群模式数量,即模型识别的群组与参考群组完全一致的情况。
- :指模型识别出的总建筑群模式数量。
-
完整率 (Completeness)
- 概念定义: 完整率衡量的是参考数据中所有真实存在的建筑群模式中,有多少被模型成功识别为“正确”模式。它关注的是模型识别结果的召回能力,即模型能够找到多少实际的正确群组。
- 数学公式:
- 符号解释:
-
:指被模型正确识别出的建筑群模式数量,即模型识别的群组与参考群组完全一致的情况。
-
:指参考数据中所有真实存在的建筑群模式数量。
此外,论文还定义了四种评估建筑群识别结果的案例:
-
-
正确模式 (Correct Patterns): 建模的模式与参考模式一致。
-
包含模式 (Inclusion Patterns): 一个建模模式包含了多个参考模式(表示欠分割,
under-segmentation)。 -
被包含模式 (Within Patterns): 一个参考模式包含了多个建模模式(表示过分割,
over-segmentation)。 -
重叠模式 (Overlap Patterns): 建模模式与参考模式之间存在重叠。
5.3. 对比基线
为了验证所提出方法的鲁棒性,论文与一种不包含建筑功能识别的方法进行了对比,即 标准 CTD 方法 (Standard CTD Method)。
- 特点:
- 该方法仅执行
Table 1中的步骤4到步骤6。 - 它仅使用 CTD 计算相邻建筑的指标值,而没有考虑建筑功能信息。
- 在图创建步骤中,无论建筑功能如何,只要两个建筑物相邻,就会在它们之间创建边。
- 该方法仅执行
- 目的: 通过对比,揭示建筑功能信息在建筑群识别中的关键作用,尤其是在处理不同功能但空间接近的建筑物时。
5.4. 实验环境
- 硬件: 个人电脑,配备 Intel (R) Core (TM) i7-7700 CPU 和 8 GB 内存。
- 软件: 所有算法均使用 C# 在 Microsoft Windows 10 (x64) 操作系统上实现。使用了 ArcGIS Engine 10.1 的组件库和工具库来开发相关算法。
6. 实验结果与分析
6.1. 核心结果分析
6.1.1. 建筑群识别结果对比
以下是原文 Figure 5 的结果:
该图像是图表,展示了研究区域在不同时间的腾讯用户密度分布,颜色由绿色至红色表示密度从低到高,图中蓝色表示建筑物轮廓,时间标注如7/5代表6月5日7时。
- 视觉效果分析 (Figure 5):
- 本文方法 (Figure 5a): 视觉上,本文方法在识别不同建筑群模式方面表现出良好效果。例如,住宅区内的建筑物被合理地分组,并与功能不同的其他建筑类型(如商业、办公)分开。蓝色斜线模式表示正确分组,红色斜线模式表示与参考地图不一致的分组。
- 标准 CTD 方法 (Figure 5b): 对比之下,标准 CTD 方法识别的结果与参考模式存在较大偏差。许多功能类型不同的建筑物(例如办公楼和住宅楼)被错误地分到同一组,这是因为它们在空间上彼此靠近,而该方法缺乏功能约束。
- 参考地图 (Figure 5c): 展示了专家手动识别的建筑群模式作为基准。
6.1.2. 建筑群模式识别的准确性评估
以下是原文 Table 2 的结果:
| Method | Proposed Method | Sum | Standard CTD Method | Sum | ||||||||||||
| Block ID | 0 | 1 | 2 | 3 | 4 | 5 | 6 | - | 0 | 1 | 2 | 3 | 4 | 5 | 6 | - |
| Number of reference groups | 26 | 15 | 27 | 7 | 9 | 4 | 6 | 94 | 26 | 15 | 27 | 7 | 9 | 4 | 6 | 94 |
| Number of modeled groups | 25 | 17 | 29 | 7 | 9 | 5 | 6 | 98 | 17 | 15 | 19 | 5 | 9 | 5 | 6 | 76 |
| Number of correct groups | 22 | 14 | 23 | 7 | 5 | 3 | 6 | 80 | 10 | 9 | 10 | 3 | 4 | 3 | 6 | 45 |
| Correctness (%) | 88.00 | 82.35 | 79.31 | 100 | 55.56 | 60 | 100 | 81.63 | 58.82 | 60.00 | 52.63 60.00 44.44 | 60.00 100 | 59.21 | |||
| Completeness (%) | 84.62 | 93.33 | 85.18 100 | 55.56 | 75.00 | 100 | 85.10 | 38.46 | 60.00 | 37.03 42.85 | 44.44 | 75.00 | 100 | 47.87 | ||
- 定量分析 (Table 2):
- 本文方法: 整体上,所提出的方法在研究区域的正确率 (Correctness) 达到了 81.63%,完整率 (Completeness) 达到了 85.10%,表明识别结果与参考数据高度一致。
- 在
Block ID为 0, 1, 3, 6 的区域获得了高精度,例如Block 3和Block 6的正确率和完整率都达到了 100%。 - 在
Block 4和Block 5区域表现相对较差,主要错误是过分割 (over-segmentation),即同一组内的建筑物之间距离较大,有时甚至大于组间距离。这表明在某些情况下,建筑物间的距离并非分组的最重要因素。
- 在
- 标准 CTD 方法: 除了
Block 6之外,标准 CTD 方法在大多数建筑块中表现不佳。由于缺乏功能信息作为约束,该方法容易导致欠分割 (under-segmentation),即将不同功能的建筑物错误地合并到同一组中。整体正确率仅为 59.21%,完整率仅为 47.87%,远低于本文方法。
- 本文方法: 整体上,所提出的方法在研究区域的正确率 (Correctness) 达到了 81.63%,完整率 (Completeness) 达到了 85.10%,表明识别结果与参考数据高度一致。
6.1.3. 腾讯用户密度分布与功能推断
以下是原文 Figure 6 的结果:
该图像是图表,展示了不同类型建筑用户密度随时间的变化趋势,包括住宅、商业和办公三类用户的平均密度。
-
用户密度分布 (Figure 6): 研究区域内不同时间的腾讯用户密度分布图显示出显著的时间变化。这意味着人们的活动空间在不同时间,尤其是在工作日和非工作日之间存在差异。这种动态变化为推断建筑功能提供了可能性。
以下是原文 Figure 7 的结果:
该图像是论文中图8的对比示意图,展示了基于DTW方法(a)与参考数据(b)识别的建筑功能分布情况,使用不同颜色区分居住、商业和办公建筑,并标注了建筑街区及其ID。 -
平均用户密度时间变化 (Figure 7):
-
商业建筑: 在两天内(工作日和非工作日),商业建筑的平均用户密度曲线呈现明显的周期性波动,深夜几乎无人。
-
住宅建筑: 住宅建筑的平均用户密度时间变化在工作日和休息日之间略有不同。
-
办公建筑: 办公建筑的平均用户密度在两天内差异显著,因为大多数人在周末不会待在工作场所。
-
结论: 这些时间模式的差异是利用 DTW 算法推断建筑功能的基础。
以下是原文 Figure 8 的结果:
该图像是论文中图9示意图,展示了分割步骤6中剩余三角形的分布情况,(a)为所提方法,(b)为标准CTD方法。红色轮廓标注的建筑群显示了错误分类的区域,插图详细放大对比了不同方法的表现。
-
-
建筑功能识别结果 (Figure 8):
- 总体精度: 建筑功能识别的总体精度达到 87.91%。
- 分类精度: 住宅、商业和办公建筑的识别精度分别为 91.70%、96.77% 和 47.82%。
- 商业建筑精度最高: 商业建筑的识别精度最高,可能是因为其用户密度曲线特征比其他两种类型更明显 (如 Figure 7 所示)。
- 办公建筑精度最低: 办公建筑的识别精度最低,原因有二:
- 办公建筑的用户密度活动曲线与住宅建筑非常相似,导致一些住宅建筑被错误识别为办公建筑。
Block 0和Block 2中的许多住宅建筑在 Baidu Maps 和 Google Earth 图像中被发现实际用作办公建筑,这使得区分它们变得困难。- COVID-19 疫情可能导致居家办公,进一步模糊了住宅和办公功能的用户密度模式。
- 对比优势: 总体识别精度高于文献[24,27]中提出的方法,这归因于腾讯用户密度数据比轨迹数据更能准确反映人口密度变化。
6.1.4. 功能信息对分组的影响
- 商业建筑分组: 本文方法在商业建筑分组方面表现出竞争力,只有一个错误群组。相比之下,标准 CTD 方法识别出三个不正确的群组。
- 办公建筑分组: 本文方法识别的办公建筑群组全部正确,而标准 CTD 方法的结果全部错误,它错误地将办公建筑和住宅建筑分到同一组。
- 共同挑战: 对于那些被错误识别为办公建筑的住宅建筑,两种方法都未能正确分组。
6.1.5. 分割过程中的三角形分析
以下是原文 Figure 9 的结果:
该图像是图表,展示了图10中两种建筑群模式识别方法的归化结果对比。左图为所提方法,右图为标准CTD方法,不同颜色圈出的错误结果分别对应包含、包含于和重叠三种模式。
- 剩余三角形 (Figure 9): 该图展示了分割过程中保留的绿色三角形(表示建筑物之间的邻近关系)。
- 本文方法 (Figure 9a): 存在过分割 (over-segmentation) 的原因有两点:
- 同一组内建筑物之间的距离差异很大 (Figure 9a(A)),有些甚至大于组间距离 (Figure 9a(B,C))。
- 异常距离导致低的连续性指数 (SCI) 值 (Figure 9a(A))。
- 标准 CTD 方法 (Figure 9b): 由于未将功能信息作为约束,除了上述原因外,还导致了更多的错误群组(欠分割)。特别是当不同功能的建筑物彼此靠近时,该方法会将它们全部归为一组 (Figure 9b(B,C))。此外,在缺乏语义信息的情况下,将学校建筑划分为不同功能的建筑群也变得困难 (Figure 9b(A))。
- 本文方法 (Figure 9a): 存在过分割 (over-segmentation) 的原因有两点:
6.1.6. 地图综合结果
以下是原文 Figure 10 的结果:
该图像是图2示意图,展示了受约束德劳内三角剖分的两个实例:(a)在每个单独建筑块内对所有建筑进行的三角剖分,(b)针对相邻建筑对的三角剖分,图中建筑以灰色和橙色区分,三角形以线框表示。
- 地图综合结果 (Figure 10):
- 欠分割 (
inclusion patterns) 的影响 (红色圆圈区域): 例如,由标准 CTD 方法导致的欠分割(即一个建模模式包含多个参考模式)在地图综合后,会使得用户在前往目的地时需要绕更多的路,因为地图上将多个独立区域错误地合并成了一个大的建成区。 - 过分割 (
within patterns) 的影响 (绿色圆圈区域): 由过分割(即一个参考模式包含多个建模模式,多发生在同一社区内的建筑物)导致的综合结果对导航影响不大。 - 标准 CTD 方法的欠分割影响: 标准 CTD 方法识别的群组导致的综合结果与欠分割结果类似,同样需要更多的绕路。
- 重叠模式 (
overlap patterns) 的影响 (蓝色圆圈区域): 由重叠模式导致的综合结果可能引起驾驶导航错误。这是因为这些综合结果之间的间隙看起来像可供行驶的道路,但实际上它们可能是住宅区内的步行道。
- 欠分割 (
- 结论: 基于本文方法识别的建筑群进行地图综合,其结果更符合日常使用的地图,因为它能为用户提供更准确的城市建筑物空间划分。
6.2. 消融实验/参数分析
论文通过对比“本文方法”和“标准 CTD 方法”来进行了隐式的消融实验。
- 核心对比点: “本文方法”额外引入了建筑功能信息作为约束,而“标准 CTD 方法”则没有。
- 结果: 实验结果清晰地表明,引入建筑功能信息(即
DTW算法推断功能)显著提升了建筑群识别的准确性和合理性(整体正确率从 59.21% 提高到 81.63%)。这证明了建筑功能信息模块对于提升模型性能的有效性,尤其是在处理功能不同但空间上接近的建筑物时,它能够避免欠分割问题。 - 参数分析: 论文提及了图分割中移除异常距离边的阈值(例如 0.2),但未进行详细的参数敏感性分析。未来工作可以探索自动校准这些参数。
7. 总结与思考
7.1. 结论总结
本研究针对传统建筑群识别方法因缺乏有效数据而只考虑建筑物几何特征,导致分组结果不尽如人意的问题,提出了一种结合建筑物几何特征和功能信息的识别方法。该方法首先利用腾讯用户密度数据和兴趣点 (POI) 数据,基于动态时间规整 (DTW) 算法推断建筑物功能。然后,在图创建阶段,仅允许具有相同功能的相邻建筑物之间形成连接,并结合从受约束德劳内三角剖分 (CDT) 导出的多种空间指标(如连续性指数、方向和距离)构建加权图。最后,通过图分割方法提取建筑群。
实验结果表明,该方法在研究区域的正确率 (correctness value) 超过 81.63%,能够产生令人满意的建筑群识别结果。与不考虑建筑功能信息的标准 CTD 方法相比,本方法在处理功能不同但空间上接近的建筑物时,有效避免了欠分割问题,显著提高了识别的准确性和合理性。此外,基于本方法识别的建筑群进行的地图综合结果,更能提供符合日常地图使用需求的城市建筑物空间划分。
7.2. 局限性与未来工作
- 局限性:
- 过分割问题: 在某些情况下,本文方法仍存在过分割 (over-segmentation) 问题,即同一群组内的建筑物距离差异大,有时甚至大于群组间的距离,或者异常距离导致较低的连续性值。这表明建筑物距离并非在所有情况下都是群组识别的最重要因素。
- 办公建筑识别精度: 办公建筑的功能识别精度相对较低 (47.82%),部分原因是其用户密度曲线与住宅建筑相似,且在实际中存在住宅转办公的现象,以及疫情期间居家办公的影响。
- 单一语义信息: 目前仅使用了建筑功能作为语义信息,可能不足以完全捕捉建筑群模式的复杂性。
- 参数校准: 图分割策略中使用的参数(如路径角阈值)目前可能需要手动设置。
- 未来工作:
- 整合更多语义信息: 除了建筑功能之外,可以测试整合更多的语义信息,例如建筑物高度,以进一步丰富建筑群的特征描述。
- 自动参数校准: 需要进一步研究以实现图分割策略中参数(如路径角阈值)的自动校准,从而提高方法的鲁棒性和易用性。
7.3. 个人启发与批判
- 启发:
- 语义信息的重要性: 这篇论文再次强调了在空间模式识别中,语义信息(如建筑功能)与几何信息同样重要,甚至在某些情况下更为关键。在复杂的城市环境中,仅仅依靠几何邻近性往往不足以反映真实的社会空间组织。
- 大数据赋能: 地理空间大数据(如社交媒体位置数据、POIs)为提取传统方法难以获取的语义信息提供了强大支持。结合这些数据与传统的空间分析技术,可以解决长期存在的挑战。
- 多源数据融合思路: 论文成功地将腾讯用户密度数据、POIs、建筑物足迹和道路网络等多种异构数据源进行整合,为解决复杂地理空间问题提供了一个很好的多源数据融合范例。
- 对地图综合的实际意义: 将建筑群识别与地图综合的应用场景紧密结合,不仅提升了识别结果的学术价值,也展现了其在实际制图和导航应用中的巨大潜力。合理的功能分区是提供“智能”地图服务的基石。
- 批判:
- 功能推断的泛化性: 论文中建筑功能推断依赖于腾讯用户密度数据和 POIs。腾讯数据在中国具有代表性,但在其他国家或地区,可能需要替换为当地主流的 LBS 数据源。此外,功能推断的准确性受限于 POIs 数据的完整性和时效性。
- “异常距离”阈值的确定: 在图分割步骤中,移除异常距离的边依赖于一个阈值(例如 0.2)。这个阈值的选择对最终的分割结果可能具有敏感性,但论文没有详细说明其确定方法,也没有进行敏感性分析。这可能会影响方法在不同研究区域的泛化能力。
- 过分割问题的原因: 论文指出了过分割问题,并归因于距离差异和 SCI 值。这可能暗示现有几何指标对某些复杂的建筑群结构描述不足,或者需要引入更多非线性、更具认知意义的几何关系度量。
- DTW 算法的计算成本: 虽然 DTW 算法在时间序列相似度测量方面表现优秀,但对于大量建筑物的两两时间序列比较,其计算成本可能较高,尤其是在更大规模的城市区域应用时,需要考虑效率优化。
- 对多功能建筑的处理: 论文主要关注单一功能的建筑类型。在现实世界中,许多大型建筑可能是多功能的(例如,底部商业,上部住宅/办公)。目前的方法可能难以精确划分这些复合功能建筑内部的群组。
- 可以改进的地方:
- 参数自适应: 引入机器学习或优化算法来自动学习和校准图分割中的参数,减少对人工经验的依赖。
- 多尺度建筑群识别: 探索如何在不同空间尺度上识别建筑群模式,因为用户对建筑群的认知可能因观察尺度而异。
- 整合深度学习: 结合卷积神经网络等深度学习方法,直接从建筑物图像和空间布局中学习更复杂的几何和语义特征,可能进一步提升识别精度。
- 用户反馈机制: 考虑引入用户众包或反馈机制来优化建筑功能推断和群组识别的参考数据,尤其是在动态变化的城市环境中。
相似论文推荐
基于向量语义检索推荐的相关论文。