论文状态:已完成

Extracting building patterns with multilevel graph partition and building grouping

发表:2016/11/11
原文链接
价格:0.100000
已有 2 人读过
本分析由 AI 生成,可能不完全准确,请以原文为准。

TL;DR 精炼摘要

本文提出基于多级图分割和建筑分组的创新方法,从遥感影像中准确提取城市建筑模式。通过递归划分建筑足迹图并结合空间结构特征,该方法能高精度识别网格状、簇状及放射状等模式,为城市规划和灾害响应提供有力工具。

摘要

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/309861890 Extracting building patterns with multilevel graph partition and building grouping Article in ISPRS Journal of Photogrammetry and Remote Sensing · November 2016 DOI: 10.1016/j.isprsjprs.2016.10.001 CITATIONS 62 READS 1,102 4 authors , including: Shihong Du Peking University 149 PUBLICATIONS 5,961 CITATIONS SEE PROFILE Mi Shu Peking University 5 PUBLICATIONS 193 CITATIONS SEE PROFILE All content following this page was uploaded by Shihong Du on 30 September 2017. The user has requested enhancement of the downloaded file.

思维导图

论文精读

中文精读

1. 论文基本信息

1.1. 标题

Extracting building patterns with multilevel graph partition and building grouping (利用多级图分割和建筑分组提取建筑模式)

1.2. 作者

Shihong Du, Liqun Luo, Kai Cao, Mi Shu

1.3. 发表期刊/会议

ISPRS Journal of Photogrammetry and Remote Sensing。该期刊是摄影测量与遥感领域的国际顶级期刊,在地理信息科学和遥感应用方面具有很高的学术声誉和影响力。

1.4. 发表年份

2016年11月

1.5. 摘要

这篇论文提出了一种利用多级图分割 (Multilevel Graph Partition) 和建筑分组 (Building Grouping) 方法从遥感影像 (Remote Sensing Imagery) 中提取建筑模式 (Building Patterns) 的方法。该方法旨在解决城市区域中建筑布局识别和分类的挑战,这对于城市规划 (Urban Planning)、灾害响应 (Disaster Response) 和基础设施管理 (Infrastructure Management) 至关重要。作者提出了一种基于图分割 (Graph Partitioning) 技术的新颖方法,用于建模和分析建筑物之间的空间关系。该方法利用多级图分割算法 (Multilevel Graph Partitioning Algorithm) 将建筑足迹图 (Building Footprint Graph) 递归分解为有意义的子图 (Subgraphs),然后根据它们的空间和结构特征进行分组。该方法旨在捕捉建筑布局中固有的规律性和结构顺序,从而识别常见的城市模式,如网格状 (Grid-like)、簇 (Cluster) 或放射状排列 (Radial arrangements)。该方法在各种城市场景中进行了验证,结果表明它能够以高精度准确地将建筑物分割成连贯的组,并提取出更高层次的模式类型。这篇论文为城市模式提取 (Urban Pattern Extraction) 贡献了一个可扩展且高效的算法,在自动化城市分析 (Automated Urban Analysis) 和地理信息系统 (Geographic Information Systems) 中具有潜在应用。

1.6. 原文链接

/files/papers/691089cb5d12d02a6339cf17/paper.pdf (此为内部文件路径,无法直接访问,但标识了其作为论文来源的身份)

2. 整体概括

2.1. 研究背景与动机

  • 论文试图解决的核心问题是什么?
    • 如何从大量的建筑物中准确、有效地识别和提取建筑模式 (Building Patterns)。
    • 现有建筑模式类型学 (Typology) 不完整,忽略了一些重要模式(如平行和垂直模式),且未能考虑不同模式之间的关联。
    • 现有提取方法在相似性度量和聚类算法方面存在不足,导致结果不尽如人意,且通常针对特定模式设计,缺乏通用性。
  • 为什么这个问题在当前领域是重要的?现有研究存在哪些具体的挑战或空白?
    • 建筑模式是地图综合 (Map Generalization) 过程中必须保留的关键配置,对于评估景观配置和估算城市人口分布至关重要。
    • 建筑模式是城市结构 (Urban Structures) 和功能 (Functions) 的重要组成部分,可以帮助理解和映射城市功能区(如住宅区、工业区、商业区)。例如,高档住宅区建筑分布规则,低档住宅区则不规则。
    • 现有研究在建筑模式的认知、类型学、表示和提取方法上存在不足。挑战在于如何综合考虑建筑的几何属性、空间关系以及人类对模式的认知方式,开发出既能处理多种模式又高效的方法。
  • 这篇论文的切入点或创新思路是什么?
    • 提出一个更完整的建筑模式类型学,包括共线模式 (Collinear Patterns)(直线和斜线)、曲线模式 (Curvilinear Patterns)、平行和垂直组 (Parallel and Perpendicular Groups) 以及网格模式 (Grid Patterns)。
    • 提出一种结合自下而上 (Bottom-up) 的建筑聚类 (Building Clustering) 和自上而下 (Top-down) 的模式识别 (Pattern Recognition) 的集成策略。
    • 利用多级图分割 (Multilevel Graph Partition) 进行高效高质量的建筑聚类,并通过Relief-F算法 (Relief-F algorithm) 自动确定相似性度量 (Similarity measurements) 的权重,克服了手动权重选择的主观性和耗时性。
    • 设计了一套系统化的规则和参数来提取不同类型的模式,并比较了不同的方向模型 (Orientation Models),发现F-直方图 (F-histogram) 在表示方向关系方面效果更优。

2.2. 核心贡献/主要发现

  • 论文最主要的贡献是什么?
    1. 更完整的建筑模式类型学: 考虑并处理了更多种类的建筑模式,包括共线模式(直线和斜线)、曲线模式、平行和垂直组,以及网格模式,弥补了现有研究模式类型较少的不足。
    2. 集成化的提取策略: 将多级图分割方法与建筑聚类相结合,有效利用了建筑的邻近性、面积、形状和距离等多种几何相似性准则,获得了高质量的建筑簇 (Building Clusters)。
    3. 系统化的模式提取方法: 提出了一套系统性的策略来提取四种类型的模式,而非像现有研究那样单独处理。
    4. 自动权重识别: 创新性地使用Relief-F算法自动优化相似性度量的权重,提高了聚类结果的客观性和效率。
    5. 方向模型比较与选择: 通过实验证明F-直方图在建模方向关系方面优于传统的质心模型 (Centroid model) 和Voronoi图 (Voronoi graph) 模型,为建筑模式提取提供了更可靠的方向度量。
  • 论文得出了哪些关键的结论或发现?这些发现解决了什么具体问题?
    • 所提出的方法能够以高准确度(超过90%)提取高质量的建筑模式,验证了其适用性和可靠性。
    • F-直方图,特别是基于最大权值方位角 (Maximum-weight azimuth) 和加权平均方位角 (Weighted-average azimuth) 的方法,在表示建筑物之间的方向关系方面表现最佳,解决了传统方向模型在考虑形状、距离和旋转方面不足的问题。
    • 多级图分割在处理大量建筑物数据时显示出高效性,能够生成高质量的建筑簇,为后续模式提取奠定基础。
    • 参数敏感性分析表明,主方向的角度差 (Angle difference of main directions) 和方位角 (Azimuth angle) 对提取结果影响显著,用户需根据需求调整参数。

3. 预备知识与相关工作

3.1. 基础概念

为了理解本文提出的方法,需要掌握以下几个基础概念:

  • 建筑模式 (Building Patterns): 指建筑物在空间中集体呈现的排列和形式,可以通过视觉识别并语义命名,例如网格状、线性、簇状等。它们是城市结构和功能的重要组成部分。
  • 图 (Graph): 由节点 (Nodes) 和边 (Edges) 组成的数据结构。在本文中,建筑物被视为节点,它们之间的空间关系(如邻近关系)被视为边。
  • 图分割 (Graph Partitioning): 将一个图的节点集合划分为若干个不相交的子集,使得每个子集内的节点之间连接紧密,而不同子集之间的连接稀疏。目标通常是最小化分割后的边切数 (Edge Cut) 或最大化子集内部的相似度。
  • 多级图分割 (Multilevel Graph Partition): 一种高效的图分割算法框架,通过将图逐渐粗化 (Coarsening) 为较小的图,在粗化后的图上进行分割,然后将分割结果逐级细化 (Refinement) 回原始图,以获得高质量的分割结果。这种方法能够显著降低计算复杂度。
  • Delaunay三角剖分 (Delaunay Triangulation): 一种将平面上的点集连接成三角形的几何结构,满足空圆 (Empty Circle) 特性,即任何一个三角形的外接圆内不包含点集中的其他点。在本文中,它被用于建立建筑物之间的邻近关系。
  • 相似度度量 (Similarity Measurements): 用于量化两个建筑物之间相似程度的指标。本文考虑了面积、形状、距离等多种相似度。
  • Relief-F算法 (Relief-F algorithm): 一种特征加权算法,用于评估不同特征对分类任务的重要性。它通过迭代计算每个特征的权重,使得与同类样本相似而与异类样本不相似的特征获得更高的权重。在本文中,它用于自动确定不同相似度度量的权重。
  • F-直方图 (F-histogram): 一种描述区域对象之间相对方向关系的方法。它将方向分解为一系列角度,并为每个角度分配一个“力”值,表示在该方向上一个对象对另一个对象的影响。它考虑了各向异性 (Anisotropy) 以及距离和形状的影响,比简单地使用质心 (Centroid) 或Voronoi图 (Voronoi graph) 更能捕捉人类的空间认知。
  • 质心模型 (Centroid model): 一种简单的方向关系模型,通过连接两个对象的质心来确定它们之间的方向。
  • Voronoi图 (Voronoi graph): 一种空间划分方法,将平面上的点集划分为若干个区域,每个区域包含一个点,且该区域内的任何一点到其对应的点比到其他点更近。在方向关系中,它有时用于定义邻近和方向。

3.2. 前人工作

  • 建筑模式的类型学 (Typology of Building Patterns):
    • 功能分类:Meinel等人(2009)根据功能将建筑分为多家庭、单家庭和非住宅建筑,但这侧重单体建筑功能而非模式。
    • 地图综合分类:Anders (2006)为地图综合将建筑模式分为线性、圆形、星形和不规则模式,但其服务于概化 (Generalization),未涵盖所有模式及模式间关联。
    • 特殊结构模式:Yang (2008)关注具有特殊结构的模式,如阶梯形、T形、L形、E形、Z形和H形。
    • 多级分类:Zhang等人(2012)提出多级分类,包括顶层的建筑簇、中间层的线性和非线性模式,底层进一步细化为共线、曲线、沿路排列模式,以及网格和非结构化模式。Zhang等人(2013a)补充了中心对齐和侧面对齐模式。
    • 本文的贡献: 现有类型学模式较少且忽略了模式间关联,本文引入了更完整的类型学,包括平行和垂直模式等。
  • 建筑模式的提取方法 (Extraction Methods for Building Patterns):
    • 聚类方法 (Clustering Methods):
      • 通常使用图表示建筑物间关系,然后根据相似性将图分割成簇。
      • 相似性度量:局部密度 (Anders et al., 1999)、质心间向量的距离和方向 (Boffet and Serra, 2001)、多参数(最小距离、视觉范围、面积比、边界比、最小包围矩形和方向Voronoi图)(Yan et al., 2008)。
      • 聚类算法:相对关系图 (Relative relation graph) (Anders et al., 1999)、最小生成树 (Minimal Spanning Tree, MST) (Regnauld, 2001; Zhang et al., 2012)、图论、Delaunay三角剖分、Voronoi图、城市形态学和完形理论 (Gestalt theory) 结合 (Li et al., 2004)。
      • 本文的贡献: 现有方法因相似性度量简单或聚类算法效率低而效果不佳。本文提出了更有效的相似性度量和多级图分割聚类算法,并引入Relief-F算法自动确定权重。
    • 模式分析方法 (Pattern Analysis Methods):
      • 设计特定参数(如邻近性、方向、路径)来衡量模式内建筑的同质性和排列。
      • 使用图表示邻近关系,探索基于图的算法。
      • 例如:线性模式的线性模板 (Christophe and Ruas, 2002)、沿路对齐和非结构化模式的Delaunay三角剖分和MST (Zhang et al., 2012)、以及中心对齐和侧面对齐模式的专用算法 (Zhang et al., 2013a)。
      • Cetinkaya等人(2015)比较了MST、ASCDT、DBSCAN和CHAMELEON四种算法,认为DBSCAN和ASCDT更适合建筑物分组。
      • 本文的贡献: 现有方法通常为提取特定模式而定制,与建筑聚类方法分离。本文提出了一种集成方法,结合聚类和模式识别的优点,以系统地提取多种模式。

3.3. 技术演进

该领域的技术演进经历了从单一特征到多特征融合、从手动参数调整到自动权重学习、从简单聚类到多级图分割、以及从特定模式提取到通用模式识别的趋势。早期的研究主要依赖于单一的几何特征(如距离、方向)和简单的图论算法(如MST)进行建筑物的分组或模式识别。随着研究的深入,多参数(面积、形状、视觉距离等)的相似性度量被引入,并开始探索更复杂的聚类算法。然而,权重的手动确定和算法的通用性仍然是挑战。本文通过引入Relief-F算法实现了权重的自动优化,并采用高效的多级图分割来提高聚类质量和效率,同时通过集成聚类和模式识别,实现了对多种复杂城市模式的系统化提取,代表了该领域向自动化、智能化和综合化方向发展的一个重要进步。

3.4. 差异化分析

本文的方法与相关工作中的主要方法相比,核心区别和创新点体现在以下几个方面:

  • 模式类型覆盖更广: 现有研究大多关注有限的模式类型(如共线、沿路对齐、特定形状)。本文则提出了一个更全面的类型学,并能系统地提取共线、曲线、平行组、垂直组和网格模式。
  • 集成化的分析流程: 多数研究将建筑聚类和模式分析视为独立的阶段。本文则提出了一种结合自下而上的多级图分割聚类和自上而下的模式识别的集成策略,使得聚类结果直接为模式提取提供先验信息,从而简化了模式提取的复杂性并提高了效率。
  • 相似度权重自动优化: 现有方法常依赖专家经验手动设定相似度度量(如面积、形状、距离)的权重,这既主观又耗时。本文创新性地引入Relief-F算法自动学习和优化这些权重,增强了方法的客观性和适应性。
  • 方向关系建模的改进: 本文深入比较了质心模型、Voronoi图和F-直方图在表示方向关系上的优劣,并通过实验验证F-直方图在考虑距离、形状和旋转方面更符合人类认知,并选择其作为核心方向度量工具。这纠正了以往可能依赖简单方向模型的不足。
  • 可扩展性与效率: 多级图分割框架本身就以其高效处理大规模图数据而闻名,使其在处理大量建筑物数据时具有更好的可扩展性,而非早期简单图算法可能面临的效率问题。

4. 方法论

4.1. 方法原理

本文提出的方法旨在通过结合自下而上 (Bottom-up) 的建筑聚类和自上而下 (Top-down) 的模式识别,从遥感影像中提取城市建筑模式。核心思想是首先利用多级图分割 (Multilevel Graph Partition) 将具有相似几何属性(面积、形状、距离)的建筑物高效地分组到同质簇 (Homogeneous Clusters) 中。在此过程中,不同相似度度量 (Similarity Measurements) 的权重通过Relief-F算法 (Relief-F algorithm) 自动确定,以确保聚类质量。然后,在这些高质量的建筑簇基础上,通过定义特定规则和参数,逐步识别和提取出不同类型的建筑模式,包括共线模式 (Collinear Patterns)、曲线模式 (Curvilinear Patterns)、平行和垂直组 (Parallel and Perpendicular Groups),以及网格模式 (Grid Patterns)。这种分层且集成的方法旨在模拟人类对城市模式的认知过程,从而实现准确、高效的模式提取。

以下是所提出的框架(Figure 2):

该图像是论文中用于展示Dataset 3数据集的建筑物平面图示意图,描绘了多个建筑物的空间分布和布局,反映出城市区域内建筑的排列特征。 该图像是论文中用于展示Dataset 3数据集的建筑物平面图示意图,描绘了多个建筑物的空间分布和布局,反映出城市区域内建筑的排列特征。

Fig. 2. The proposed framework for extracting building patterns.

该框架由以下三个主要部分组成:

  • 聚类建筑物 (Clustering buildings): 这一步根据邻近性、面积、形状和距离等建筑特征的相似性将建筑物分组。它为提取建筑模式提供了先验信息。由于这一步不依赖任何先验知识,因此是一个自下而上的过程。
  • 提取共线模式 (Extracting collinear patterns): 这一步根据建筑物的排列参数,并在聚类结果的指导下,提取共线模式和曲线模式。
  • 提取网格模式 (Extracting grid patterns): 第三步首先定义共线模式的平行和垂直组,然后从垂直组中提取网格模式。

4.2. 核心方法详解

4.2.1. 聚类建筑物

建筑物聚类分为四个步骤:首先,使用Delaunay三角剖分 (Delaunay Triangulation) 建立建筑物之间的邻近关系。其次,定义包括面积、形状和距离在内的几何相似度。第三,使用Relief-F算法 (Relief-F algorithm) 识别每个相似度的权重,并定义总相似度。最后,使用多级图分割方法 (Multilevel Graph Partition method) 对建筑物进行聚类。

4.2.1.1. 构建邻近图

为了在研究区域内获得平滑连续的三角剖分,在建筑物轮廓中插入了更多近似等距的点。插值间隔取决于所有轮廓上点之间的最小距离 (Ai and Zhang, 2007)。通过插值后的建筑物轮廓,构建三角剖分。然而,并非所有三角形都对建模建筑物之间的空间邻近关系有用,例如那些位于建筑物轮廓内部的、仅与研究区域边界连接的,以及同时与研究区域边界和单个建筑物连接的三角形(Figure 3a)。因此,只保留了那些仅连接两个相邻建筑物边的三角形。通过这种方式,可以获得改进的三角剖分(Figure 3b)。

以下是邻近关系图示(Figure 3):

Fig. 13. Extracted collinear patterns in Dataset 3. 该图像是图表,展示了论文中数据集3的提取共线建筑模式。图中用不同颜色和边界表示建筑物及其空间关系,蓝色连接线突出显示共线排列的建筑群落结构。

Fig. 3. Neighboring relations between buildings.

如果两个建筑物在改进的三角剖分中通过一条边连接,它们互为邻居。邻近图 (Neighborhood Graph) G=(V,E)G = (V, E) 用于表示邻近关系,其中 VV 代表建筑物集合, EE 代表表示邻近关系的边集合。

4.2.1.2. 定义相似度度量

相似度度量可以衡量建筑物在空间位置和几何属性(包括面积、形状和距离)上的相似性。在本研究中,相似度仅对相邻建筑物有意义,因此计算受前一步骤创建的邻近图 GG 的指导。为了说明,符号 A, B, C 指代相邻建筑物,而 E(A, B) 指代 AABB 之间的边。

  • 面积相似度 (Area Similarity) 面积相似度可以衡量两个建筑物尺寸上的相似性。如果 Area(A)Area(B) 分别表示建筑物 AABB 的面积,且 Area(A)Area(B)Area(A) \le Area(B) 成立,则建筑物 AABB 的面积相似度,记作 EArea(A,B)E_{Area}(A, B),由下式给出: EArea(A,B)=Area(A)Area(B) E_{Area}(A, B) = \frac{Area(A)}{Area(B)}

    • Area(A): 建筑物 AA 的面积。
    • Area(B): 建筑物 BB 的面积。
    • EArea(A,B)E_{Area}(A, B): 建筑物 AABB 的面积相似度。
  • 形状相似度 (Shape Similarity) 形状相似度可以通过矩形度 (Rectangularity) 和长宽比 (Length-width ratio) 来衡量。

    • 矩形度相似度 (Rectangularity similarity): 由于建筑物的形状通常规则且近似矩形,矩形度 (Rectangularity) 非常有用。矩形度定义为建筑物面积与其最小包围矩形 (Smallest Bounding Rectangle, SBR) 面积之比(Figure 4)。 以下是最小包围矩形示意图(Figure 4):

      Fig. 14. Extracted grid patterns in Dataset 3. 该图像是论文中图14的示意图,展示了数据集3中提取的网格状建筑模式,图中用蓝色标注出具有典型网格结构的建筑群,反映了多层次图划分方法在识别城市建筑布局中的应用效果。

      F 4. The mallest bounding recangleo a bulig. 如果 Rec(A)Rec(B) 分别指建筑物 AABB 的矩形度,且 Rec(B)Rec(A)Rec(B) \ge Rec(A) 成立,则它们的相似度,记作 ERec(A,B)E_{Rec}(A, B),定义为较小矩形度与较大矩形度之比(公式 (2))。 ERec(A,B)=Rec(A)Rec(B) E_{Rec}(A, B) = \frac{Rec(A)}{Rec(B)}

      • Rec(A): 建筑物 AA 的矩形度。
      • Rec(B): 建筑物 BB 的矩形度。
      • ERec(A,B)E_{Rec}(A, B): 建筑物 AABB 的矩形度相似度。
    • 长宽比相似度 (Similarity of the length-width ratio): 建筑物形状差异很大,而矩形度相似度无法完全解释这种变化。长宽比可以弥补这一局限性。 对于建筑物 AA,其长宽比 LTW(A) 指的是 AA 的最小包围矩形 (SBR) 的长度与其宽度之比。与矩形度相似度类似,如果 LTW(B)LTW(A)LTW(B) \ge LTW(A),则长宽比相似度 ELTW(A,B)E_{LTW}(A, B) 由下式给出: ELTW(A,B)=LTW(A)LTW(B) E_{LTW}(A, B) = \frac{LTW(A)}{LTW(B)}

      • LTW(A): 建筑物 AA 的长宽比。
      • LTW(B): 建筑物 BB 的长宽比。
      • ELTW(A,B)E_{LTW}(A, B): 建筑物 AABB 的长宽比相似度。
    • 总形状相似度: 对于建筑物 AABB,它们的总形状相似度 EShape(A,B)E_{Shape}(A, B) 定义为矩形度相似度和长宽比相似度的加权平均值。 EShape(A,B)=wRec×ERec(A,B)+wLTW×ELTW(A,B) E_{Shape}(A, B) = w_{Rec} \times E_{Rec}(A, B) + w_{LTW} \times E_{LTW}(A, B)

      • wRecw_{Rec}: 矩形度相似度的权重。
      • wLTWw_{LTW}: 长宽比相似度的权重。
      • EShape(A,B)E_{Shape}(A, B): 建筑物 AABB 的总形状相似度。
  • 距离相似度 (Distance similarity) 距离可以直接反映相关性的强度。本文使用视觉距离 (Visual distance) (Zhang et al., 2012),因为它更接近人类认知,通过强连接的三角形来测量。对于建筑物 AABB,如果 T(A, B) 指的是具有强连接的三角形集合,则它们的距离相似度 EDis(A,B)E_{Dis}(A, B) 定义为: EDis(A,B)=tiT(A,B)di×witiT(A,B)wi E_{Dis}(A, B) = \frac{\sum_{t_i \in T(A, B)} d_i \times w_i}{\sum_{t_i \in T(A, B)} w_i}

    • T(A, B): 连接建筑物 AABB 的强连接三角形集合。

    • wiw_i: 连接两个建筑物边之间两个中点之间的长度。

    • did_i: 建筑物之间的局部距离(Figure 5)。如果三角形是锐角或直角, did_i 是与建筑物共享边的高度;如果三角形是钝角, did_i 是连接两个建筑物三角形的最短边。

    • EDis(A,B)E_{Dis}(A, B): 建筑物 AABB 的距离相似度。 以下是基于三角形的视觉距离示意图(Figure 5):

      Fig. 15. Index distributions of collinear patterns. 该图像是一个柱状图,展示了图15中共线图案的索引分布情况,横坐标为不同索引区间,纵坐标为对应长度的频数或计数。图中数据集中反映了共线图案的频率分布特征。

    Fig. 5. The visual distance based on triangles.

  • 总相似度 (Total similarity) 相邻建筑物的总相似度是归一化后的面积、形状和距离相似度的加权和(公式 (6))。 ETotal(A,B)=wiEi(A,B) E_{Total}(A, B) = \sum w_i \cdot E_i(A, B)

    • ETotal(A,B)E_{Total}(A, B): 建筑物 AABB 的总相似度。
    • i=1,2,3i = 1, 2, 3: 分别指代面积、形状和距离相似度。
    • wiw_i: 对应相似度 Ei(A,B)E_i(A, B) 的权重,所有权重的和为 1.0。 所有相似度的取值范围都是 (0, 1]。值越大,相似度越高。

4.2.1.3. 识别所有相似度的权重

计算总相似度时,如何确定公式 (4) 和 (6) 中的权重是一个挑战。大多数现有研究通过试错法 (trial-and-error) 确定权重,这不仅主观,而且对于从大量可能性中获取最优权重来说耗时。因此,本研究使用Relief-F算法 (Relief-F algorithm) 自动优化权重并减少耗时。

Relief算法 (Kira and Rendell, 1992) 因其简单性、直观性和高效计算而被广泛应用于许多领域 (Zhang et al., 2009)。该算法为每个特征分配一个初始权重,通过更新公式训练权重,最终突出与结果强相关的特征。然而,该算法只能处理两类问题,因此本研究利用Relief-F算法 (Kononenko, 1994) 来处理多类问题。

对于建筑物集合 S={S1,S2,,SN}\mathcal{S} = \{S_1, S_2, \ldots, S_N\}Si={Si1,Si2,,SiM}{S_i} = \{S_{i1}, S_{i2}, \ldots, S_{iM}\} 指的是第 ii 个建筑物的特征,而 Class={Class1,Class2,,ClassP}Class = \{Class_1, Class_2, \ldots, Class_P\} 指的是簇。SiS_i 的每个特征都经过训练,以获取属于同一簇的 kk 个最近邻居和属于不同簇的 kk 个最近邻居。建筑物 SiS_i 的第 jj 个特征的权重根据公式 (7) 更新: wji=wji1+1kN[dismiss(Si,k)dishit(Si,k)] w_j^i = w_j^{i-1} + \frac{1}{k \cdot N} [dis_{miss}(S_i, k) - dis_{hit}(S_i, k)]

  • wjiw_j^i: 第 ii 次迭代时,第 jj 个特征的权重。

  • wji1w_j^{i-1}: 第 i-1 次迭代时,第 jj 个特征的权重。

  • kk: 最近邻居的数量。

  • NN: 建筑物总数。

  • dismiss(Si,k)dis_{miss}(S_i, k): SiS_ikk 个不同簇样本之间的区分度。

  • dishit(Si,k)dis_{hit}(S_i, k): SiS_ikk 个相同簇样本之间的区分度。

    其中 dishit(Si,k)dis_{hit}(S_i, k)dismiss(Si,k)dis_{miss}(S_i, k) 分别指 SiS_i 与相同簇样本和不同簇样本之间的区分度。它们通过公式 (8) 和 (9) 定义: dishit(Si,k)=m=1kSijShitmjmax(Sj)min(Sj) dis_{hit}(S_i, k) = \sum_{m=1}^k \frac{|S_{ij} - S_{hit mj}|}{max(S_{*j}) - min(S_{*j})} dismiss(Si,k)=CClass(Si)k[P(C)1P(Class(Si))m=1kSijSmissmjmax(Sj)min(Sj)] dis_{miss}(S_i, k) = \sum_{C \neq Class(S_i)}^k \left[ \frac{P(C)}{1 - P(Class(S_i))} \sum_{m=1}^k \frac{|S_{ij} - S_{miss mj}|}{max(S_{*j}) - min(S_{*j})} \right]

  • max(Sj)max(S_{*j})min(Sj)min(S_{*j}): 分别指第 jj 个特征的最大值和最小值。

  • P(C): 第 CC 个簇出现的概率,即第 CC 个簇中建筑物数量与建筑物总数之比。

  • SijS_{ij}: 建筑物 SiS_i 的第 jj 个特征值。

  • ShitmjS_{hit mj}: 属于与 SiS_i 相同簇的第 mm 个最近邻居的第 jj 个特征值。

  • SmissmjS_{miss mj}: 属于与 SiS_i 不同簇的第 mm 个最近邻居的第 jj 个特征值。

  • Class(Si)Class(S_i): 建筑物 SiS_i 所属的簇。

4.2.1.4. 利用多级图分割聚类建筑物

建筑物聚类通过图分割方法实现,旨在将图分割成一组满足相似性约束的子图 (Wang et al., 2015; Karypis and Kumar, 1998)。与其他图分割方法相比,多级图分割框架 (Karypis and Kumar, 1998) 因其更好的性能和效率而被广泛使用。多级图分割包括以下四个步骤 (Wang et al., 2014):

  • 图构建 (Graph construction): 这一步构建一个加权图。每个建筑物被表示为一个节点,两个相邻建筑物(参照3.1节)通过一条边连接,其权重等于总相似度(公式 (6)),其中公式 (6) 中的权重由Relief-F算法自动识别。从建筑物数据构建的图是最精细的图。
  • 图粗化 (Graph coarsening): 这一步通过合并节点和边将最精细的图转换为较小的图 (Karypis and Kumar, 1998),并分层组织这些小图。从最精细的图开始,在较精细层次上具有最大相似度的相邻节点被合并到较粗糙层次的节点中,从而从最精细的图创建一系列小而粗化的图。
  • 图分割 (Graph partition): 这一阶段可以结合特定领域的先验知识,将图粗化步骤中生成的粗化图分割成簇。在本研究中,由于没有可用的先验知识,因此将最粗糙图中的每个节点视为一个单独的簇。
  • 图细化 (Graph refinement): 前两步从最精细的图生成多级图,并获得初始簇以使簇内相似度最大化。图细化旨在通过考虑簇之间的信息来优化初始聚类结果。这一步交换相邻簇之间的边界节点,以使簇间相似度最小化。

4.2.2. 提取共线建筑模式

4.2.2.1. 共线模式的定义

共线模式不仅是城市建筑的主要模式,也是提取其他类型模式的基础。它们可以根据以下标准进行衡量:

  • 相似性 (Similarity): 面积、形状和距离相似的建筑物应属于同一模式。

  • 邻近性 (Proximity): 空间上相邻的建筑物倾向于在同一模式中。

  • 连续性 (Continuity): 空间上连续分布的建筑物倾向于在同一模式中。

  • 方向性 (Directionality): 以相似方向排列的建筑物更容易形成模式。方向不仅指建筑物自身的绝对方向,也指模式中建筑物之间的相对方向。

    相似性标准通过多级图分割的建筑物聚类来实现,确保每个簇中的建筑物在面积、形状和距离上相似(公式 (6))。邻近性通过邻近图建模,因为所有空间相邻的建筑物都通过图中的边连接。连续性和方向性衡量建筑物的排列方式,并强烈依赖于建筑模式的类型;因此,它们将根据模式类型进行考虑。由于提取是基于邻近图的,邻近性被直接考虑。因此,一个模式可以通过整合两部分来定义(公式 (10)):整体相似性(所有模式类型相同),以及连续性和方向性(因模式而异)。 {(ETotal(A,B)>εSim)(ETotal(B,C)>εSim)(ECon(A,B)>εCon)(ECon(B,C)>εCon) \left\{ \begin{array}{ll} (E_{Total}(A, B) > \varepsilon_{Sim}) \wedge (E_{Total}(B, C) > \varepsilon_{Sim}) \\ (E_{Con}(A, B) > \varepsilon_{Con}) \wedge (E_{Con}(B, C) > \varepsilon_{Con}) \end{array} \right. 在公式 (10) 中,εSim\varepsilon_{Sim}εCon\varepsilon_{Con} 分别是整体相似度和建筑物排列的阈值。 ETotal(A,B)E_{Total}(A, B)ETotal(B,C)E_{Total}(B, C) 指的是整体相似度(公式 (6)),而 ECon(A,B)E_{Con}(A, B)ECon(B,C)E_{Con}(B, C) 衡量连续性和方向性,它们根据模式类型由公式 (11) 和 (16) 进一步明确。

4.2.2.2. 提取规则

由于相似性标准已由簇中的建筑物满足,因此仅考虑连续性和方向性标准来从建筑簇中提取共线模式。这两个标准意味着同一模式中的两个建筑物在主方向上必须相似(例如,角度差小于一个小的阈值,公式 (11) 中的第一个条件),并且排列成一条线,即不同建筑物的方位角近似等于 π\pi(公式 (11) 中的第二个条件),这是将共线模式从两个建筑物的小模式增长为更多建筑物的大模式的先决条件。此外,为了区分直线模式和斜线模式(Figure 1),直线模式需要建筑物之间有一定程度的重叠,而斜线模式则不需要(公式 (11) 中的第三个条件)。 {(EDir(A,B)<εDir)(EDir(B,C)<εDir)πEOri(A,B,C)<εOriMin(EPro(A,B)εPro)(EPro(B,C)εPro) \left\{ \begin{array}{ll} (E_{Dir}(A, B) < \varepsilon_{Dir}) \wedge (E_{Dir}(B, C) < \varepsilon_{Dir}) \\ |\pi - E_{Ori}(A, B, C)| < \varepsilon_{Ori}^{Min} \\ (E_{Pro}(A, B) \ge \varepsilon_{Pro}) \wedge (E_{Pro}(B, C) \ge \varepsilon_{Pro}) \end{array} \right. 在公式 (11) 中,EDir(A,B)E_{Dir}(A, B)EDir(B,C)E_{Dir}(B, C) 指的是两个建筑物主方向的角度差,EOri(A,B,C)E_{Ori}(A, B, C) 是三个建筑物的方位角,而 EPro(A,B)E_{Pro}(A, B)EPro(B,C)E_{Pro}(B, C) 是投影重叠度 (Projection overlapping degrees)。这三个参数如Figure 6 所示,并在下一小节定义。在 Figure 6 中,L1/L2L_1 / L_2 指的是建筑物 BBCC 的投影重叠,VDir(B)V_{Dir}(B) 是建筑物 BB 的主方向, θ\theta 是方位角。εPro,εDir,和 εOriMin\varepsilon_{Pro}, \varepsilon_{Dir}, \text{和 } \varepsilon_{Ori}^{Min} 是投影重叠度、主方向角度差和方位角的阈值。如果建筑物 A, B, C 满足公式 (11),它们将构成一个共线模式,记作 Coll(A, B, C)。通过重复使用公式 (11),可以获得包含更多建筑物的共线模式。

以下是共线模式几何参数示意图(Figure 6):

该图像是一个柱状图,展示了Dataset 3中不同区间的数据分布情况,横轴为区间范围,纵轴为对应频数。主要数值集中在0.0-0.1区间,其他区间数据较少。 该图像是一个柱状图,展示了Dataset 3中不同区间的数据分布情况,横轴为区间范围,纵轴为对应频数。主要数值集中在0.0-0.1区间,其他区间数据较少。

Fig. 6. Illustration of geometric parameters for collinear patterns.

4.2.2.3. 提取参数

公式 (11) 中的三个几何参数(即投影重叠度、角度差和方位角)定义如下。

  • 投影重叠度 (Projection overlapping): 如果建筑物 CC 被视为参考, L1L_1 表示 BBCCCC 的主方向上的投影的最大重叠长度, L2L_2 是两个投影的总长度,那么投影重叠度(Figure 6) EPro(B,C)E_{Pro}(B, C) 可以定义为: EPro(B,C)=L1L2 E_{Pro}(B, C) = \frac{L_1}{L_2}

    • L1L_1: 建筑物 BBCCCC 的主方向上的投影的最大重叠长度。
    • L2L_2: 建筑物 BBCCCC 的主方向上的投影的总长度。
    • EPro(B,C)E_{Pro}(B, C): 建筑物 BBCC 的投影重叠度。
  • 主方向的角度差 (Angle difference of main directions): 建筑物 AA 的主方向 VDir(A)V_{Dir}(A) 指的是从 SBR(A) 的长轴到水平轴的角度(Figure 6),因此两个主方向的角度差定义为两个建筑物主方向之间的差值(公式 (13))。因为这个角度是周期性的,所以主方向应映射到 [0,π)[0, \pi) 区间,主方向的角度差应映射到 [0,π/2][0, \pi/2] 区间。 EDir(A,B)=VDir(A)VDir(B) E_{Dir}(A, B) = |V_{Dir}(A) - V_{Dir}(B)|

    • VDir(A)V_{Dir}(A): 建筑物 AA 的主方向。
    • VDir(B)V_{Dir}(B): 建筑物 BB 的主方向。
    • EDir(A,B)E_{Dir}(A, B): 建筑物 AABB 主方向的角度差。
  • 方位角 (Azimuth angle): 衡量建筑物之间的相对方向。三种模型(即质心模型 (Centroid model)、Voronoi图 (Voronoi graph) 和F-直方图 (F-histogram))有用,因此需要进行比较分析以选择一个好的模型。

    为了有效描述区域对象之间的相对方向,模型必须考虑尺寸、距离和旋转的影响。质心模型 (Keller and Wang, 1995) 将方位角定义为连接两个建筑物质心的线与水平轴之间的角度。因此,它只能应用于形状规则的对象,因为它不考虑形状和距离。Voronoi图 (Yan et al., 2006) 根据建筑物数据的Voronoi图确定方向关系,但它没有有效考虑距离的影响。F-直方图 (Matsakis and Wendling, 1999; Matsakis et al., 2010) 考虑了各向异性 (anisotropy) 以及不同距离和形状的影响。因此,F-直方图可能是建模建筑物方位角的合适选择,这将在实验部分进一步证明。

    F-直方图将从建筑物 AABB 的相对方向描述为元组 (θi,FAB(θi))(\theta_i, \mathcal{F}_{AB}(\theta_i)) 的组合,其中值 FAB(θi)\mathcal{F}_{AB}(\theta_i) 表示 AA 在方向 θi\theta_i 上对 BB 施加的“力”,即 BB 属于 AA 的方向 θi\theta_i 的权重。计算值 FAB(θi)\mathcal{F}_{AB}(\theta_i) 时会考虑距离信息。距离越近,方向关系的隶属度 (membership degree) 越大。Figure 7 展示了从建筑物 AABB 的两个F-直方图,其中水平轴和垂直轴分别指方向 θi\theta_i 和值 FAB(θi)\mathcal{F}_{AB}(\theta_i)。 以下是F-直方图示意图(Figure 7):

    该图像是一个图表,显示了Dataset 2中不同点数量对应的平均指数和准确率变化趋势,横轴为点数,纵轴左侧是平均指数,右侧是准确率百分比。 该图像是一个图表,显示了Dataset 2中不同点数量对应的平均指数和准确率变化趋势,横轴为点数,纵轴左侧是平均指数,右侧是准确率百分比。

    Fig. 7. F-histogram.

    基于F-直方图,本研究提出了两种测量方位角的方法。第一种方法称为最大权值方位角 (maximum-weight azimuth),将具有最大值的方向视为建筑物之间的方位角。对于建筑物 AABB,方位角 EOri(A,B)=argmaxθi(FAB(θi))E_{Ori}(A, B) = \mathrm{argmax}_{\theta_i} (\mathcal{F}_{AB}(\theta_i))。第二种方法是加权平均方位角 (weighted-average azimuth),将F-直方图中方向的加权平均值视为建筑物之间的方位角(公式 (14))。 EOri(A,B)=FAB(θi)θi E_{Ori}(A, B) = \sum \mathcal{F}_{AB}(\theta_i) \cdot \theta_i

    • FAB(θi)\mathcal{F}_{AB}(\theta_i): 建筑物 AA 在方向 θi\theta_i 上对 BB 施加的“力”值。
    • θi\theta_i: 方向角度。
    • EOri(A,B)E_{Ori}(A, B): 建筑物 AABB 之间的方位角。
  • 方位角 (Azimuth angle) 多个建筑物之间的角度: 指的是多个建筑物之间的角度(Figure 8 中的角度 θ\theta)。角度越接近 π\pi,共线模式越好。设 EOri(A,B)E_{Ori}(A, B)EOri(B,C)E_{Ori}(B, C) 分别是 AABB 之间以及 BBCC 之间的方位角,则方位角定义为: EOri(A,B,C)={EOri(A,B)EOri(B,C)if EOri(A,B)EOri(B,C)πEOri(A,B)EOri(B,C)if EOri(A,B)<EOri(B,C) E_{Ori}(A, B, C) = \left\{ \begin{array}{ll} |E_{Ori}(A, B) - E_{Ori}(B, C)| & \text{if } E_{Ori}(A, B) \ge E_{Ori}(B, C) \\ \pi - |E_{Ori}(A, B) - E_{Ori}(B, C)| & \text{if } E_{Ori}(A, B) < E_{Ori}(B, C) \end{array} \right.

    • EOri(A,B,C)E_{Ori}(A, B, C): 三个建筑物 A, B, C 构成的方位角。

    • EOri(A,B)E_{Ori}(A, B): 建筑物 AABB 之间的方位角。

    • EOri(B,C)E_{Ori}(B, C): 建筑物 BBCC 之间的方位角。

      公式 (15) 中的两个条件分别对应 Figure 8 中的两种情况。对于第一种情况,EOri(A,B)EOri(B,C)E_{Ori}(A, B) \ge E_{Ori}(B, C);对于第二种情况,EOri(A,B)<EOri(B,C)E_{Ori}(A, B) < E_{Ori}(B, C)。 以下是多个建筑物方位角示意图(Figure 8):

    Fig. 16. Index distributions of grid patterns. 该图像是图16,展示了两组数据(Dataset 2和Dataset 3)中网格模式指数的分布柱状图,反映不同指数区间内的数值频率差异。

    Fig. 8. The azimuth angle of multiple buildings. θ\theta refers to the azimuth angle, while EMPY δ\delta is the bisector direction angle of the azimuth angle.

4.2.2.4. 提取方法

提取算法 (Algorithm 1) 包含三个步骤,解释如下:

首先,基于邻近图 GG(3.1 节),步骤 1 使用投影重叠度 (projection overlapping degree) 将相邻建筑物分为两组:直线排列组 (straight-line groupings) 和斜线排列组 (oblique-line groupings)。

其次,从直线排列组中的第一个分组开始,步骤 2 选择该分组中两个相邻建筑物作为建筑模式,并通过添加更多其他建筑物来使其增长。如果新建筑物以及连接该建筑物与模式中现有建筑物之间的边满足主方向角度差 (angle difference of main directions) 和方位角 (azimuth angle) 的规则,则将该建筑物添加到模式中,并插入一条新边。模式的增长重复进行,直到分组中没有建筑物满足规则。对于直线排列组中的每个分组,步骤 2 可以迭代以找到所有直线排列模式。对于斜线排列组,过程类似。

最后,由于获得的模式可能存在重叠,需要进行后处理(步骤 3)。因此,在重叠模式中只保留包含更多建筑物的大模式。对于斜线模式,如果涉及的建筑物少于三个,则可以删除它们。

Algorithm 1: Extracting collinear building patterns Input: building clusters; constraints (建筑物簇;约束条件) Output: collection of collinear building patterns (共线建筑模式集合) 1: Initializing directed edges according to the projection overlapping degree; (根据投影重叠度初始化有向边;) 2: Extracting the initial collinear building patterns; (提取初始共线建筑模式;) For each directed edge (υ0,υ1)(\upsilon_{0}, \upsilon_{1}): υ0=\upsilon_0 = the begin node, υ1=\upsilon_1 = the end node do (对于每条有向边 (υ0,υ1)(\upsilon_{0}, \upsilon_{1})υ0=\upsilon_0 = 起始节点,υ1=\upsilon_1 = 结束节点 执行) loop (循环) initialized directed edge υ2=\upsilon_2 = the adjacent node of ν1\nu_1: (初始化有向边 υ2=\upsilon_2 = ν1\nu_1 的相邻节点:) if EDir(ν0,ν1)E_{Dir}(\nu_0, \nu_1) and EDir(ν1,ν2)E_{Dir}(\nu_1, \nu_2) satisfy the angle difference rule of main directions then (如果 EDir(ν0,ν1)E_{Dir}(\nu_0, \nu_1)EDir(ν1,ν2)E_{Dir}(\nu_1, \nu_2) 满足主方向角度差规则 则) if EOri(ν0,ν1,ν2)E_{Ori}(\nu_0, \nu_1, \nu_2) satisfy the azimuth angle rule then (如果 EOri(ν0,ν1,ν2)E_{Ori}(\nu_0, \nu_1, \nu_2) 满足方位角规则 则) add ν2\nu_2 to the building pattern and form a new directed edge (ν1,ν2)(\nu_1, \nu_2) (将 ν2\nu_2 添加到建筑模式中,并形成一条新的有向边 (ν1,ν2)(\nu_1, \nu_2)) break (跳出循环) else (否则) break; (跳出循环;) endloop; else (否则) break; (跳出循环;) endloop; 3: Acquiring the final collinear patterns by post-processing. (通过后处理获得最终的共线模式。)

4.2.3. 提取曲线模式

4.2.3.1. 提取规则

曲线模式 (Curvilinear Patterns) 的建筑物排列与共线模式 (Collinear Patterns) 大相径庭。共线模式中的建筑物主方向和方位角近似相等;而曲线模式中的建筑物主方向和方位角则可能差异很大并相互作用。因此,曲线模式的提取需要考虑方位角和方向的偏差。通常,偏差可以通过方位角和方向的允许范围来衡量。 {{(πEOri(A,B,C)εOriMin)(EDirN(A,B,C)VDir(B)εDirMax)}{(εOriMin<πEOri(A,B,C)εOriMax)(EDirN(A,B,C)VDir(B)εDirVar)} \left\{ \begin{array}{ll} \{ (|\pi - E_{Ori}(A, B, C)| \le \varepsilon_{Ori}^{Min}) \wedge (|E_{Dir}^N(A, B, C) - V_{Dir}(B)| \le \varepsilon_{Dir}^{Max}) \} \\ \{ (\varepsilon_{Ori}^{Min} < |\pi - E_{Ori}(A, B, C)| \le \varepsilon_{Ori}^{Max}) \wedge (|E_{Dir}^N(A, B, C) - V_{Dir}(B)| \le \varepsilon_{Dir}^{Var}) \} \end{array} \right. 在公式 (16) 中,符号 VDir(B)V_{Dir}(B) 指建筑物 BB 的主方向,EOri(A,B,C)E_{Ori}(A, B, C) 是建筑物 A, B, C 的方位角,EDirN(A,B,C)E_{Dir}^N(A, B, C) 是方位角的平分方向角。 [εOriMin,εOriMax][\varepsilon_{Ori}^{Min}, \varepsilon_{Ori}^{Max}] 衡量补充方位角的允许范围,而 [εDirVar,εDirMax][\varepsilon_{Dir}^{Var}, \varepsilon_{Dir}^{Max}] 是方向的允许范围。如果三个建筑物 A, B, C 满足公式 (16),它们就构成一个曲线模式,记作 Curv(A, B, C)。类似地,通过重复使用公式 (16),可以获得包含更多建筑物的曲线模式。

根据视觉感知,曲线模式的允许范围是方位角补角从 4040^\circ6060^\circ,方向偏差范围应在 ±15\pm 15^\circ 之间 (Field et al., 1993)。当补角 15\le 15^\circ 时,阈值可设为 1515^\circ;当补角增大时,阈值应线性减小。根据相关研究结果和实验验证,本研究将方向偏差阈值设定如下:当补角 15\le 15^\circ 时,阈值为 1515^\circ;当补角 >15> 15^\circ 时,阈值逐渐线性减小;当补角达到最大值 2525^\circ 时,阈值设为 0,这意味着无法提取曲线模式。

4.2.3.2. 提取参数

方位角的平分方向角 (Bisector direction angle of the azimuth angle) 定义为从平分方向到水平轴的角度,记作 δ\delta(Figure 8)。设 EOri(A,B)E_{Ori}(A, B) 表示 AABB 之间的方位角,EOri(B,C)E_{Ori}(B, C) 表示 BBCC 之间的方位角,则平分角 EDirN(A,B,C)E_{Dir}^N(A, B, C) 由公式 (17) 定义。Figure 8 对应公式 (17) 中的两种情况。 EDirN(A,B,C)={(EOri(A,B)+EOri(B,C))/2if EOri(A,B)EOri(B,C)(πEOri(A,B)EOri(B,C))/2+EOri(A,B)if EOri(A,B)<EOri(B,C) E_{Dir}^N(A, B, C) = \left\{ \begin{array}{ll} (E_{Ori}(A, B) + E_{Ori}(B, C)) / 2 & \text{if } E_{Ori}(A, B) \ge E_{Ori}(B, C) \\ (\pi - |E_{Ori}(A, B) - E_{Ori}(B, C)|) / 2 + E_{Ori}(A, B) & \text{if } E_{Ori}(A, B) < E_{Ori}(B, C) \end{array} \right.

  • EDirN(A,B,C)E_{Dir}^N(A, B, C): 三个建筑物 A, B, C 构成的方位角的平分方向角。
  • EOri(A,B)E_{Ori}(A, B): 建筑物 AABB 之间的方位角。
  • EOri(B,C)E_{Ori}(B, C): 建筑物 BBCC 之间的方位角。

4.2.3.3. 提取方法

曲线模式可以根据识别规则和识别参数从建筑簇中提取。曲线模式的提取与共线模式的提取非常相似,因此在此省略详细描述和算法。

4.2.4. 评估建筑模式

4.2.4.1. 评估共线模式

在提取阶段,共线模式以增长方式提取,这意味着通过逐步将新建筑物添加到现有模式中(如果添加的建筑物满足相应的提取规则)来获得模式。因此,需要将模式作为一个整体来评估提取模式的质量 (Zhang et al., 2013b)。根据共线模式的排列和人类认知心理学,考虑以下四个原则:(1) 同质性 (Homogeneity),(2) 建筑物数量 (Number of buildings),(3) 主方向 (Main direction),和 (4) 方位角 (Azimuth angle)。也就是说,前两个越大,后两个越小,模式的质量越好。

基于这四个原则,共线模式 Coll(k) 的质量指标 Qcoll(k)Q_{coll}(k) 定义为: Qcoll(k)=Homcoll(k)Numcoll(k)+MeancollDir(k)+StdcollOri(k)90 Q_{coll}(k) = \frac{Hom_{coll}(k)}{Num_{coll}(k)} + \frac{Mean_{coll}^{Dir}(k) + Std_{coll}^{Ori}(k)}{90} 其中, Hom(k)=wihomi(k) Hom(k) = \sum w_i \cdot hom_i(k) homi(k)={Stds(k)/Means(k)Stdt(k) hom_i(k) = \left\{ \begin{array}{ll} Std_s(k) / Mean_s(k) \\ Std_t(k) \end{array} \right.

  • Homcoll(k)Hom_{coll}(k): 模式 Coll(k) 的同质性,是面积、形状和距离同质性的加权平均值。

  • Numcoll(k)Num_{coll}(k): 模式 Coll(k) 中建筑物的数量。

  • MeancollDir(k)Mean_{coll}^{Dir}(k): 关于主方向的角度差的平均值。

  • StdcollOri(k)Std_{coll}^{Ori}(k): 建筑物方位角的标准差。

  • wiw_i: 每种同质性的权重,由Relief-F算法识别。

  • ss: 指面积或距离相似度。

  • tt: 指矩形度和长宽比。

  • Stds(k)Std_s(k): 模式 kk 中类型 ss 的标准差。

  • Means(k)Mean_s(k): 模式 kk 中类型 ss 的平均值。

  • Stdt(k)Std_t(k): 模式 kk 中类型 tt 的标准差。

    在公式 (19) 中,wiw_i 是每种同质性的权重,由Relief-F算法识别。Hom(k) 值越小,簇的同质性越好。在公式 (20) 中,ss 指面积或距离相似度,而 tt 指矩形度和长宽比。对于面积和距离相似度,Homi(k)Hom_i(k) 同时考虑了数据归一化和相对尺度问题,即在相同的标准差下。平均值越大,同质性越好。此外,公式 (18) 中的 90 用于归一化主方向角度差的平均值和方位角的标准差。归一化后,Qcoll(k)Q_{coll}(k) 小于 3.0。值越小,共线模式的质量越好。

4.2.4.2. 评估曲线模式

评估曲线模式的质量时,考虑三个因素:同质性 (Homogeneity)、建筑物数量 (Number of buildings) 和方向偏差 (Direction deviation)。也就是说,前两个越大,最后一个越小,模式的质量越好。

曲线模式 Curv(k) 的质量指标 QCurv(k)Q_{Curv}(k) 定义为: QCurv(k)=HomCurv(k)NumCurv(k)+StdCurvDir(k)90 Q_{Curv}(k) = \frac{Hom_{Curv}(k)}{Num_{Curv}(k)} + \frac{Std_{Curv}^{Dir}(k)}{90}

  • HomCurv(k)Hom_{Curv}(k): 由公式 (19) 和 (20) 定义的曲线模式的同质性。

  • NumCurv(k)Num_{Curv}(k): 曲线模式中建筑物的数量。

  • StdCurvDir(k)Std_{Curv}^{Dir}(k): 模式中的方向偏差标准差。

    与公式 (18) 类似,质量指标 QCurv(k)Q_{Curv}(k) 小于 2.0。值越小,曲线模式的质量越好。

4.2.5. 提取网格建筑模式

4.2.5.1. 网格模式的定义

网格模式 (Grid Patterns) 是建筑物的典型模式,具有层次化的拓扑配置。从全局角度看,网格模式由两组共线模式 (Collinear Patterns) 组成,其中同一组中的模式彼此大致平行,而不同组中的模式彼此垂直。从局部角度看,网格模式由具有相似尺寸、形状、方向和距离的建筑物组成。网格模式分为两种类型:规则网格 (Regular Grid) 和不规则网格 (Irregular Grid)。对于规则网格(Figure 9a),任何共线模式必须至少垂直于另一组中的一个模式;而对于不规则网格(Figure 9b),一组中至少一个共线模式垂直于另一组中至少一个模式。

以下是网格建筑模式示意图(Figure 9):

该图像是一个折线图,展示了Dataset 2中不同数据点下指标平均值和准确率的变化趋势。图中用折线表示指标平均值和准确率两组数据,横轴为数据点,纵轴分别对应指标值和准确率百分比。 该图像是一个折线图,展示了Dataset 2中不同数据点下指标平均值和准确率的变化趋势。图中用折线表示指标平均值和准确率两组数据,横轴为数据点,纵轴分别对应指标值和准确率百分比。

Fig. 9. Grid building patterns.

符号 ParaA={ColAi}i=1MPara_A = \{Col_A^i\}_{i=1}^MParaB={ColBj}j=1NPara_B = \{Col_B^j\}_{j=1}^N 指两组共线模式,ColDiriCol_{Dir}^iColDirjCol_{Dir}^j 分别是模式 ColAiCol_A^iColBjCol_B^j 的全局方向,TProxi,jT_{Prox}\langle i, j \rangleColAiCol_A^iColBjCol_B^j 之间的邻近关系,TIntei,jT_{Inte}\langle i, j \rangle 是两个模式之间的拓扑相交 (Topological intersection)。如果两组 ParaAPara_AParaBPara_B 满足公式 (22),它们就构成一个网格模式,记作 Grid(i, j){(TProxi,i+1=1)(ColDiriColDiri+1<εDirPara)(TProxj,j+1=1)(ColDirjColDirj+1<εDirPara)(TIntei,j=1)(ColDiriColDirjπ/2<εDirVert) \left\{ \begin{array}{ll} (T_{Prox}\langle i, i+1 \rangle = 1) \land (|Col_{Dir}^i - Col_{Dir}^{i+1}| < \varepsilon_{Dir}^{Para}) \\ (T_{Prox}\langle j, j+1 \rangle = 1) \land (|Col_{Dir}^j - Col_{Dir}^{j+1}| < \varepsilon_{Dir}^{Para}) \\ (T_{Inte}\langle i, j \rangle = 1) \land (|Col_{Dir}^i - Col_{Dir}^j - \pi / 2| < \varepsilon_{Dir}^{Vert}) \end{array} \right.

  • ParaA,ParaBPara_A, Para_B: 两组共线模式。

  • ColAi,ColBjCol_A^i, Col_B^j: 模式 ParaAPara_AParaBPara_B 中的第 ii 个和第 jj 个共线模式。

  • ColDiri,ColDirjCol_{Dir}^i, Col_{Dir}^j: 共线模式 ColAiCol_A^iColBjCol_B^j 的全局方向。

  • TProxi,jT_{Prox}\langle i, j \rangle: 共线模式 ColAiCol_A^iColBjCol_B^j 之间的邻近关系(1表示邻近,0表示不邻近)。

  • TIntei,jT_{Inte}\langle i, j \rangle: 共线模式 ColAiCol_A^iColBjCol_B^j 之间的拓扑相交(1表示相交,0表示不相交)。

  • εDirPara\varepsilon_{Dir}^{Para}: 平行模式的全局方向差阈值。

  • εDirVert\varepsilon_{Dir}^{Vert}: 垂直模式的全局方向差阈值。

    公式 (22) 中的前两个条件定义了如果共线模式在空间上相邻且全局方向相似,则它们是平行的。第三个条件可以进一步确定两组平行共线模式是否形成网格模式。

4.2.5.2. 网格模式的提取

网格模式可以根据以下步骤提取。首先,根据全局方向从共线模式中识别出平行组 (Parallel Groups) 的共线模式。其次,通过使用全局方向差从平行模式中识别出垂直组 (Perpendicular Groups) 的共线模式。最后,基于拓扑相交 (Topological intersection) 和连通性 (Connectivity),获得网格模式。

  • 提取平行组的共线模式 (Extracting parallel groups of collinear patterns): 对于共线模式 ColACol_AColBCol_B,设 TProxA,BT_{Prox}\langle A, B \rangle 为它们的邻近关系, ColDirACol_{Dir}^AColDirBCol_{Dir}^B 为它们的全局方向。如果这些参数满足公式 (23),则两个模式 ColACol_AColBCol_B 将是平行的,记作 Para(ColA,ColB)Para(Col_A, Col_B){TProxA,B=1ColDirAColDirB<εDirPara \left\{ \begin{array}{ll} T_{Prox}\langle A, B \rangle = 1 \\ |Col_{Dir}^A - Col_{Dir}^B| < \varepsilon_{Dir}^{Para} \end{array} \right.

    • TProxA,BT_{Prox}\langle A, B \rangle: 共线模式 ColACol_AColBCol_B 的拓扑邻近关系(1表示邻近)。

    • ColDirA,ColDirBCol_{Dir}^A, Col_{Dir}^B: 共线模式 ColACol_AColBCol_B 的全局方向。

    • εDirPara\varepsilon_{Dir}^{Para}: 平行模式的全局方向差阈值。

      通过扩展,可以获得 ParaGroup(ColA,ColB,,ColN)ParaGroup(Col_A, Col_B, \ldots, Col_N) 形式的平行组。

    • 拓扑邻接关系 (Topological adjacency relations): 由于共线模式是从同一簇中的建筑物提取的,因此共线模式之间的邻接关系也限制在同一簇中。 对于同一簇 kk^* 中的共线模式 ColkiCol_k^iColkjCol_k^j,如果在 ColkiCol_k^i 中的建筑物 VisV_i^sColkjCol_k^j 中的建筑物 VjtV_j^t 空间相邻,则模式 ColkiCol_k^iColkjCol_k^j 也空间相邻。根据邻近关系,建筑物邻近图 G=(V,E)G=(V, E) 可以转换为共线模式邻近图 GkCol=(VkCol,EkCol)G_k^{Col} = (V_k^{Col}, E_k^{Col}),其中 VkColV_k^{Col} 表示共线模式,EkColE_k^{Col} 指共线模式之间的空间邻近关系。

    • 共线模式的全局方向 (Global orientation of collinear patterns): 全局方向描述了共线模式的方向趋势,通过模式中所有建筑物的平均方位角来衡量。 对于共线模式 Col(V1,V2,,VN)Col(V_1, V_2, \ldots, V_N),设 EOri(Vi,Vj)E_{Ori}(V_i, V_j) 是相邻建筑物 ViV_iVjV_j 之间的方位角,则该模式的全局方向,记作 ColDirCol_{Dir},由下式给出: ColDir=EOri(Vi,Vj)N Col_{Dir} = \frac{\sum E_{Ori}(V_i, V_j)}{N}

      • EOri(Vi,Vj)E_{Ori}(V_i, V_j): 相邻建筑物 ViV_iVjV_j 之间的方位角。
      • NN: 模式中建筑物的数量。
      • ColDirCol_{Dir}: 共线模式的全局方向。 其中方位角 EOri(Vi,Vj)E_{Ori}(V_i, V_j) 在计算全局方向之前需要归一化。当 EOri(Vi,Vj)E_{Ori}(V_i, V_j)[πεOriMin,π)[\pi - \varepsilon_{Ori}^{Min}, \pi) 范围内时,需要使用公式 (25) 进行转换。 EOri(Vi,Vj)=πEOri(Vi,Vj) E_{Ori}(V_i, V_j) = \pi - E_{Ori}(V_i, V_j)
  • 提取垂直组的共线模式 (Extracting perpendicular groups of collinear patterns): 对于共线建筑模式 ColACol_AColBCol_B,设 TInteA,BT_{Inte}\langle A, B \rangle 为它们的拓扑相交关系, ColDirACol_{Dir}^AColDirBCol_{Dir}^B 分别为它们的全局方向。如果这些参数满足公式 (26),则共线模式 ColACol_AColBCol_B 将形成一个垂直组,记作 Vert(ParaA,ParaB)Vert(Para_A, Para_B){TInteA,B=1ParaDirAParaDirBπ/2<εDirVert \left\{ \begin{array}{ll} T_{Inte}\langle A, B \rangle = 1 \\ |Para_{Dir}^A - Para_{Dir}^B - \pi / 2| < \varepsilon_{Dir}^{Vert} \end{array} \right.

    • TInteA,BT_{Inte}\langle A, B \rangle: 共线模式 ColACol_AColBCol_B 的拓扑相交关系(1表示相交)。

    • ParaDirA,ParaDirBPara_{Dir}^A, Para_{Dir}^B: 平行模式组 ParaAPara_AParaBPara_B 的全局方向。

    • εDirVert\varepsilon_{Dir}^{Vert}: 垂直模式的全局方向差阈值。

      拓扑相交和平行模式的全局方向定义如下。

    • 拓扑相交关系 (Topological intersection relation): 如果共线模式 ColkiCol_k^iColkjCol_k^j 具有共同的建筑物,它们将拓扑相交。此外,对于两组共线模式 ParaAPara_AParaBPara_B,如果至少存在一对拓扑相交模式,它们将拓扑相交。

    • 平行模式的全局方向 (Global orientation of parallel patterns): 全局方向衡量所有平行模式的总体趋势,主要指所有共线模式全局方向的平均值。 对于平行模式 Para(Col1,Col2,,ColN)Para(Col_1, Col_2, \ldots, Col_N),其全局方向 ParaDirPara_{Dir} 定义为: ParaDir=ColDiriN Para_{Dir} = \frac{\sum Col_{Dir}^i}{N}

      • ColDiriCol_{Dir}^i: 模式 ColiCol_i 的全局方向。
      • NN: 平行模式组中包含的共线模式数量。
      • ParaDirPara_{Dir}: 平行模式组的全局方向。
  • 提取网格模式 (Extracting grid patterns): 对于垂直组 ParaAPara_AParaBPara_B,设 TIntei,jT_{Inte}\langle i, j \rangle 为共线模式之间的拓扑相交, DegreeViDegree_{V_i} 为建筑物 ViV_i 在垂直组中的连通性 (Connectivity)。如果这些参数满足公式 (28),则垂直组 ParaAPara_AParaBPara_B 形成一个网格模式,记作 Grid(i, j){TIntei,j=1DegreeVi2 \left\{ \begin{array}{ll} T_{Inte}\langle i, j \rangle = 1 \\ Degree_{V_i} \ge 2 \end{array} \right.

    • TIntei,jT_{Inte}\langle i, j \rangle: 共线模式之间的拓扑相交(1表示相交)。

    • DegreeViDegree_{V_i}: 建筑物 ViV_i 的连通性。

      其中建筑物的连通性指模式中相邻建筑物的数量。如果建筑物 ViV_i 在模式中有 NN 个相邻建筑物,则 DegreeVi=NDegree_{V_i} = N

4.2.5.3. 评估网格模式

网格模式的质量可以根据以下标准进行评估:同质性 (Homogeneity)、建筑物数量 (Number of buildings) 和全局方向 (Global orientation)。也就是说,网格模式中共线模式的全局方向标准差越小,质量越好。

对于网格模式 Grid(i, j)HomGrid(i,j)Hom_{Grid}(i, j) 指同质性,StdGridDir(i)Std_{Grid}^{Dir}(i)StdGridDir(j)Std_{Grid}^{Dir}(j) 指共线模式全局方向的标准差,NumGrid(i,j)Num_{Grid}(i, j) 是建筑物的数量,则质量指标 QGrid(i,j)Q_{Grid}(i, j) 定义为: QGrid(i,j)=HomGrid(i,j)NumGrid(i,j)+StdGridDir(i)+StdGridDir(j)90 Q_{Grid}(i, j) = \frac{Hom_{Grid}(i, j)}{Num_{Grid}(i, j)} + \frac{Std_{Grid}^{Dir}(i) + Std_{Grid}^{Dir}(j)}{90}

  • HomGrid(i,j)Hom_{Grid}(i, j): 由公式 (19) 和 (20) 定义的网格模式的同质性。

  • NumGrid(i,j)Num_{Grid}(i, j): 网格模式中建筑物的数量。

  • StdGridDir(i),StdGridDir(j)Std_{Grid}^{Dir}(i), Std_{Grid}^{Dir}(j): 网格模式中两组共线模式的全局方向标准差。

    在公式 (29) 中,HomGrid(i,j)Hom_{Grid}(i, j) 由公式 (19) 和 (20) 定义。归一化后的指标 QGrid(i,j)Q_{Grid}(i, j) 小于 3。值越小,网格模式越好。

5. 实验设置

5.1. 数据集

实验使用了比例尺为 1:10,000 的建筑物数据。由于实验数据覆盖范围广且建筑物分布分散,因此选择了三块建筑物密集且排列规则的数据进行实验分析(Figure 10)。

以下是实验数据集示意图(Figure 10):

Fig. 2. The proposed framework for extracting building patterns. 该图像是论文中图2,展示了提出的建筑模式提取框架的流程示意图,包含自底向上的建筑聚类、多层次图划分,以及自顶向下的共线、网格模式提取步骤。

Fig. 3. Neighboring relations between buildings. 该图像是论文中图3的示意图,展示了两种不同的Delaunay三角剖分方式。左图为原始剖分,右图为改进后的剖分,通过调整连接关系以更好地反映建筑邻接关系。

a Dataset 1

该图像是一个示意图,展示了多边形区域A及其空间扩展区域`SBR(A)`的关系,图中用虚线框出扩展区域,形象说明了建筑分组中的空间邻接概念。 该图像是一个示意图,展示了多边形区域A及其空间扩展区域SBR(A)的关系,图中用虚线框出扩展区域,形象说明了建筑分组中的空间邻接概念。

b Dataset 2 Fig. 10. Experimental datasets.

  • Dataset 1: 包含64栋建筑物(Figure 11a)。用于分析三种方向模型(质心模型、Voronoi图模型、F-直方图)在提取建筑模式中的作用。
  • Dataset 2: 包含139栋建筑物(Figure 11b)。用于验证所提出方法的适用性和可靠性,包括质量评估、准确度评估和参数敏感性分析。
  • Dataset 3: 包含2141栋建筑物(Figure 11c)。位于中国北京市的市区,建筑物不仅分布密集,而且在类型、尺寸和形状上高度多样化,例如有许多商业、文化教育和工业建筑,以及大量的非正式住区和开发区。因此,数据的数量和多样性有助于测试所提出方法的适用性和可靠性。

5.2. 评估指标

评估提取建筑模式的准确度 (Accuracy) 可以使用两个度量:正确性 (Correctness) 和完整性 (Completeness)。

  • 正确性 (Correctness): 指正确提取的模式数量占总提取模式数量的比例。它衡量了提取结果中假阳性 (False Positives) 的数量。 Correctness=TPTP+FP Correctness = \frac{TP}{TP + FP} 其中, TP (True Positives) 是正确提取的模式数量,FP (False Positives) 是错误提取的模式数量,TP+FPTP + FP 是所有提取的模式数量。

  • 完整性 (Completeness): 指正确提取的模式数量占数据集中所有真实存在模式数量的比例。它衡量了提取结果中假阴性 (False Negatives) 的数量。 Completeness=TPTP+FN Completeness = \frac{TP}{TP + FN} 其中, TP (True Positives) 是正确提取的模式数量,FN (False Negatives) 是未被提取的模式数量,TP+FNTP + FN 是数据集中所有真实存在的模式数量。

为了评估准确度,共有10名具有制图背景的工程师和10名学生参与了视觉和手动识别模式。如果提取的模式与视觉解释结果一致,则该模式是正确的;如果不同,则不正确。

5.3. 对比基线

在分析方向模型的影响时,论文将自己的方法(基于F-直方图的改进最大权值方位角和加权平均方位角)与以下两种广泛使用的方向模型进行了比较:

  • 质心模型 (Centroid model): 一种通过连接建筑物质心来确定方向关系的模型 (Keller and Wang, 1995)。
  • Voronoi图模型 (Voronoi graph model): 一种基于建筑物数据Voronoi图来确定方向关系的模型 (Yan et al., 2006)。

6. 实验结果与分析

6.1. 影响因素:方向模型

Dataset 1(Figure 10a)包含64栋建筑物,用于分析三种方向模型在提取建筑模式中的作用,包括质心模型 (Centroid model)、Voronoi图 (Voronoi graph) 模型和F-直方图 (F-histogram)。

通过Relief-F算法自动获取的Dataset 1的权重如下(Table 1)。

以下是原文 Table 1 的结果:

Data Weights The threshold of overall similarity
Area Rectangularity Length-width ratio Distance
Dataset 1 0.320 0.247 0.309 0.124 0.850
Dataset 2 0.246 0.327 0.329 0.098 0.850
Dataset 3 0.230 0.332 0.217 0.221 0.850

基于Table 1中的相应权重,获得了14个簇(Figure 11a)。显然,这些簇具有高质量,因为每个簇中的建筑物在视觉上是同质的,并且完整性 (Completeness) 和正确性 (Correctness) 也足够高(Table 2)。

以下是Dataset 1的聚类结果(Figure 11):

Fig. 5. The visual distance based on triangles. 该图像是论文中的示意图,展示了基于三角形的视觉距离计算方法,图中标注了距离 did_i 和权重 wiw_i,用于表征建筑物空间关系。

Figure 11b-e 分别展示了使用三种方向模型提取的模式。质心模型 (Centroid model) 和F-直方图 (F-histogram) 产生的结果优于Voronoi图 (Voronoi graph) 模型,因为前两种模型导致了更高的准确度(即正确性和完整性)(Table 2)。然而,质心模型仅适用于规则形状的建筑物,因此其作用有限。因此,F-直方图被选为衡量方向关系以提取建筑模式的方法。

以下是原文 Table 2 的结果:

Orientation model Correctness (%) Completeness (%)
Centroid model 100.0 91.3
Voronoi graph model 95.2 87.0
F-histogram (maximum weight azimuth) 100.0 95.7
F-histogram (weighted average azimuth) 100.0 100.0

报告的准确度(Table 2)进一步表明F-直方图是最可靠和适用的,因为它具有最高的准确度。基于F-直方图的改进最大权值方位角 (maximum weight azimuth) 和加权平均方位角 (weighted average azimuth) 方法在建模建筑物之间的方向关系方面表现良好,因此它们能够有效地支持建筑模式的提取。通过将全局方向阈值设置为15,全局方向差阈值设置为10,从提取的共线模式 (collinear patterns) 中生成了三个网格模式 (grid patterns)(Figure 11f)。可以看出,所有网格模式都是规则的且质量很高。

6.2. 适用性和可靠性

6.2.1. 结果展示

Dataset 2(Figure 11b)和Dataset 3(Figure 11c)用于验证所提出方法的适用性和可靠性,包括质量评估、准确度评估和参数敏感性分析。它们分别包含139和2141栋建筑物。研究区域位于中国北京市的市区。建筑物不仅分布密集,而且在类型、尺寸和形状上高度多样化。例如,有许多商业、文化教育和工业建筑,以及大量的非正式住区和开发区。因此,所用数据的数量和多样性有助于测试所提出方法的适用性和可靠性。

根据Table 1中的权重,这两个数据集分别对应37和811个簇。在获得的簇的约束下,分别获得了55和619个共线模式(Figure 12a 和 Figure 13)。最后,从相应的共线模式中分别提取了5个和116个网格模式(Figure 12b 和 Figure 14)。

以下是Dataset 2提取的共线模式(Figure 12a)和网格模式(Figure 12b):

Fig. 6. Illustration of geometric parameters for collinear patterns. 该图像是图6,示意两种共线建筑模式的几何参数。图中通过角度θ、方向量VDir(B)V_{Dir}(B)及距离L1L_1L2L_2表示建筑体块之间的空间关系。

Fig. 8. The azimuth angle of multiple buildings. \(\\theta\) refers to the azimuth angle, while EMPY \(\\delta\) is the bisector direction angle of the azimuth angle. 该图像是示意图,展示了多栋建筑物的方位角关系。图中用 heta 表示方位角,EMPY oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{oldsymbol{ heta}}}}}}}}}}}}}}}}}}} 表示方位角的平分角,描述建筑群的空间方向特征。

Fig. 12.

以下是Dataset 3提取的共线模式(Figure 13):

该图像是论文中展示的示意图,比较了建筑排列的两种模式:a部分为共线模式,b部分为网格模式,并用虚线和红色框标示了建筑群的边界和典型区域,体现了多层次图划分和建筑分组的应用。 该图像是论文中展示的示意图,比较了建筑排列的两种模式:a部分为共线模式,b部分为网格模式,并用虚线和红色框标示了建筑群的边界和典型区域,体现了多层次图划分和建筑分组的应用。

Fig. 13. Extracted collinear patterns in Dataset 3.

以下是Dataset 3提取的网格模式(Figure 14):

Fig. 14. Extracted grid patterns in Dataset 3. 该图像是论文中图14的示意图,展示了数据集3中提取的网格状建筑模式,图中用蓝色标注出具有典型网格结构的建筑群,反映了多层次图划分方法在识别城市建筑布局中的应用效果。

Fig. 14. Extracted grid patterns in Dataset 3.

6.2.2. 质量评估

根据建筑模式的评估标准,分别计算了Dataset 2和Dataset 3中建筑模式的质量指标。由于这两个数据集中模式数量众多,Table 3 仅报告了质量指标的最大值、最小值和平均值。

以下是原文 Table 3 的结果:

Data Quality indices of collinear patterns Quality indices of grid patterns
Maximum Minimum Average Maximum Minimum Average
Dataset 2 0.141 0.003 0.044 0.093 0.035 0.067
Dataset 3 1.082 0.001 0.073 0.135 0.010 0.053

由于质量指标的最大值、最小值和平均值仅反映了提取模式的总体质量,因此使用质量指标的直方图来解释指标的分布情况(Figure 15 和 Figure 16)。横轴表示指标的区间,而纵轴表示质量指标落入每个区间的模式数量。 明确的是,共线模式和网格模式的质量指标主要分布在 [0, 0.1] 区间内,而很少在 [0.2, 1.0] 区间。对于一个提取的模式,当其指标小于0.1时,质量令人满意;当其指标大于0.2时,质量不可接受;当指标范围在0.1到0.2之间时,质量正常。为了评估所有提取模式的总体质量,使用了优秀率 (excellent rate),即满意和正常模式数量与提取模式总数之比。

以下是共线模式的质量指标分布图(Figure 15):

Fig. 16. Index distributions of grid patterns. 该图像是图16,展示了两组数据(Dataset 2和Dataset 3)中网格模式指数的分布柱状图,反映不同指数区间内的数值频率差异。

Fig. 15. Index distributions of collinear patterns.

以下是Dataset 3共线模式的质量指标分布图:

该图像是一幅建筑布局示意图,展示了基于多级图分割和建筑群分组方法提取的建筑空间分布和排列模式,体现了城市区域中不同建筑组合的结构特征。 该图像是一幅建筑布局示意图,展示了基于多级图分割和建筑群分组方法提取的建筑空间分布和排列模式,体现了城市区域中不同建筑组合的结构特征。

以下是网格模式的质量指标分布图(Figure 16):

该图像是建筑群布局的示意图,展示了利用多层次图划分方法提取出的建筑分布形态,反映了建筑的空间关系和排列规律。 该图像是建筑群布局的示意图,展示了利用多层次图划分方法提取出的建筑分布形态,反映了建筑的空间关系和排列规律。

Fig. 16. Index distributions of grid patterns.

6.2.3. 准确度评估

Dataset 2和Dataset 3中提取模式的准确度 (Accuracy)(Table 4)表明,所提出的方法可以为共线模式和网格模式产生令人满意的结果。此外,实验中使用的大量建筑物数据表明,所提出的方法是可靠和适用的。

以下是原文 Table 4 的结果:

Data Collinear patterns Grid patterns
Correctness (%) Completeness (%) Correctness (%) Completeness (%)
Dataset 2 90.9 92.6 100.0 83.3
Dataset 3 92.8 95.6 93.9 95.1

6.2.4. 参数敏感性分析

由于所提出的方法涉及许多参数,因此需要分析这些参数对提取结果的影响。由于共线模式是分析其他模式的基础,因此仅分析了共线模式中涉及的参数。在分析不同参数对模式提取的影响时,使用模式总数、提取模式的优秀率 (excellent rate) 和质量指标的平均值作为参考。与共线模式相关的参数包括公式 (11) 中的投影重叠度 EProE_{Pro}、主方向的角度差 EDirE_{Dir} 和方位角 EOriE_{Ori}。第一个参数可以区分直线和斜线共线模式,而后两个参数可以影响提取的共线模式。因此,仅分析后两个参数的影响。

首先分析了公式 (11) 中角度差 EDirE_{Dir} 的影响。投影重叠度 (projection overlapping degree) 和方位角 (azimuth angle) 的阈值分别固定为0.5和15,而角度差的阈值分别从6、8、10、12变化到14。相应的结果如Figure 17所示。随着角度差阈值的增加,质量指标的平均值增加,而优秀率下降。这意味着主方向的角度差与提取结果呈负相关。此外,随着角度差阈值的增加,提取的共线模式数量增加。这表明角度差的增加实际上放松了对共线模式的约束,从而增加了提取模式的数量并降低了结果的质量。

以下是角度差 EDirE_{Dir} 对提取结果的影响图(Figure 17):

该图像是多模型建筑群空间结构示意图,展示了建筑簇(a)、中心模型(b)、沃罗诺依图模型(c)、F-直方图最大权值方向(d)、加权平均方向(e)及网格模式(f)的对比,体现建筑模式的多层次分析。 该图像是多模型建筑群空间结构示意图,展示了建筑簇(a)、中心模型(b)、沃罗诺依图模型(c)、F-直方图最大权值方向(d)、加权平均方向(e)及网格模式(f)的对比,体现建筑模式的多层次分析。

espevely, wi th ndy rtil xi eent eexellen the xc pats.

其次分析了方位角(公式 (11) 中的 EOriE_{Ori})的影响。方位角的阈值分别设置为11、13、15、17和19。随着方位角阈值的增加,Dataset 2和Dataset 3的质量指标平均值趋于增加,而Dataset 2的优秀率保持不变,但Dataset 3的优秀率下降(Figure 18)。这意味着方位角也与提取准确度呈负相关。此外,随着方位角阈值的增加,提取的共线模式数量下降。原因是对于较大的阈值,更多建筑物满足共线模式的条件,因此由较小阈值产生的更多小模式被合并,导致提取模式数量下降。

以下是方位角 EOriE_{Ori} 对提取结果的影响图(Figure 18):

该图像是论文中展示的示意图,比较了建筑排列的两种模式:a部分为共线模式,b部分为网格模式,并用虚线和红色框标示了建筑群的边界和典型区域,体现了多层次图划分和建筑分组的应用。 该图像是论文中展示的示意图,比较了建筑排列的两种模式:a部分为共线模式,b部分为网格模式,并用虚线和红色框标示了建筑群的边界和典型区域,体现了多层次图划分和建筑分组的应用。

Fi 18. secondary vertical axis represents the excellent rates of the extracted patterns.

对于网格模式 (grid patterns),应分析与共线模式的平行和垂直组相关的参数影响。根据全局方向 (global orientation) 和全局方向差 (global orientation difference) 的定义,随着全局方向和全局方向差的增加,提取的网格模式数量将增加,而质量和准确度将下降。

6.3. 讨论

现有研究主要关注建筑聚类 (Building Clustering) 和模式提取 (Pattern Extraction)。一方面,现有聚类方法 (Li et al., 2004; Cetinkaya et al., 2015) 只能将相似的建筑物分组,但无法获得有意义的模式。另一方面,现有模式分析方法旨在提取特定模式,如沿路对齐和共线模式,因此它们不适用于提取其他模式。然而,本研究结合了这两种方法的优点来提取多种建筑模式。首先,多级图分割 (Multilevel Graph Partition) 能够高效地获得高质量的同质建筑物簇 (Karypis and Kumar, 1998),然后基于图的分组方法可以帮助从簇中提取模式。模式提取基于建筑聚类结果,因此提取方法简单但准确度高。实验表明,所提出的方法可以产生高质量的簇(Figures 11, 14)并发现具有高准确度(超过90%)的多种模式。

与现有工作相比,本研究处理了更多类型的建筑模式,包括共线模式(直线和斜线模式)、曲线模式、平行和垂直组以及网格模式。然而,现有工作主要关注共线、沿路对齐和非结构化模式 (Zhang et al., 2012),或H形、Z形、E形、I形和阶梯形等特殊模式 (Yang, 2008)。此外,这些模式之间存在强烈的关联,这要求提取方法应精心设计并配备以系统而全面地提取这些模式。与现有研究不同,本研究提出了这种全面而系统的方法来处理本研究中涉及的所有模式。

两个重要参数(即主方向的角度差 (angle difference of the main directions) 和方位角 (azimuth angle))对建筑模式提取的准确度有重要影响。这两个参数越大,提取模式的数量越少,提取模式的质量越低。因此,这两个参数的值必须由用户根据其需求指定。仍有一些参数可能对模式提取有影响,但手动设置为固定值。因此,这些参数如何与结果相互作用需要在未来的工作中进一步探索。

本研究使用Relief-F算法 (Relief-F algorithm) 自动确定相似度度量 (similarity measurements) 的最优权重,而现有研究通常手动选择权重。一个大问题是,手动加权对于从大量可能组合中找到最佳权重组合来说非常耗时。

Relief-F算法可以自动从数据中学习权重,从而帮助用户解决这个问题。由于该算法是数据驱动的,它能够适应数据,找到能够产生更好结果的局部权重。对于大型数据集,对所有数据采用相同的权重可能不合适,因为所有数据的全局权重可能无法产生良好结果,而适应局部数据的局部权重可能产生良好结果。因此,应鼓励使用产生良好结果的自适应权重。Relief-F算法的一个局限性是不同数据可能导致不同的权重。然而,关于手动确定的全局权重或从数据中自动学习的局部权重哪个更好,还需要进一步进行定量评估,因为目前还没有原则性的方法来了解答案。

最后,本研究还表明,F-直方图 (F-histogram) 在表示方向关系以分析建筑模式方面优于质心模型 (centroid) 和Voronoi图模型 (Voronoi graph),而现有研究通常使用质心或Voronoi图来表示方向关系。

7. 总结与思考

7.1. 结论总结

本研究提出了一种结合建筑聚类和模式分析方法的建筑模式提取策略。在方法论方面,首先使用多级图分割 (Multilevel Graph Partition) 来发现具有相似尺寸、形状、面积和距离的同质建筑物的全局最优簇,然后使用基于图的分组方法从同一簇中的建筑物中提取多种模式。在实验方面,选择了三个数据集来测试方向模型 (Orientation Models) 的影响,评估提取模式的质量 (Quality) 和准确度 (Accuracy),并分析参数敏感性 (Parameter Sensitivity)。结果表明,所提出的策略能够以超过90%的准确度产生高质量的模式,并且F-直方图 (F-histogram) 在提取建筑模式方面优于质心模型 (Centroid Model) 和Voronoi图模型 (Voronoi Graph Models)。

7.2. 局限性与未来工作

  • 局限性:
    • 共线模式提取中,主方向的角度差 (Angle difference of main directions) 和方位角 (Azimuth angle) 两个参数对结果影响显著,其阈值需要用户根据需求手动指定,缺乏自动校准机制。
    • 除了上述两个关键参数外,仍有一些参数(例如聚类中的阈值、Relief-F算法的 kk 值等)目前是手动设置为固定值,其对结果的相互作用和影响尚未被充分探索。
    • 尽管Relief-F算法能够自动学习局部权重,但全局权重和局部权重之间的定量评估以及何种情况更优仍需深入研究。
  • 未来工作:
    • 将提取的模式应用于多样化的领域,例如分析城市景观配置和功能,以及辅助遥感影像的解译。
    • 进一步研究如何自动校准所提出策略中使用的参数,以减少对用户经验的依赖。

7.3. 个人启发与批判

  • 个人启发:
    • 集成方法的优势: 本文将自下而上的聚类与自上而下的模式识别相结合,提供了一个全面的解决方案,这比单一阶段的方法更有效。这种分层处理复杂问题的思路,值得在其他领域借鉴。先进行粗粒度的分组,再在组内进行细粒度的模式识别,可以有效降低复杂度并提高准确性。
    • 自动权重学习的重要性: Relief-F算法自动确定相似度权重,极大地提高了方法的客观性和自动化程度。在数据驱动的时代,减少人工干预和主观判断,让算法从数据中学习是提升模型鲁棒性和泛化能力的关键。
    • 深入理解空间关系: F-直方图在描述相对方向关系上的优越性,提醒我们在处理空间数据时,应超越简单的几何概念(如质心),深入考虑更符合人类认知的复杂空间关系(如距离、形状和各向异性)。
    • 分步验证与参数敏感性分析: 论文详细分析了不同方向模型的优劣,并进行了参数敏感性分析,这对于理解模型的行为和指导实际应用至关重要。
  • 批判与潜在改进:
    • 模式类型定义的模糊性: 尽管论文声称提供了更完整的类型学,但在某些模式(如直线和斜线共线模式的区分、规则和不规则网格的定义)的界限上,仍然依赖于相对主观的阈值(如投影重叠度)。未来可以探索更具统计学或语义学意义的、数据驱动的模式分类方法。
    • 参数自动校准的缺失: 论文承认参数设置对结果影响显著,但并未提供自动校准参数的方案。这在实际应用中仍是一个挑战。可以尝试引入强化学习、贝叶斯优化或多目标优化等方法来自动寻找最优参数组合。
    • 对不规则模式的处理: 论文明确指出其重点是规则模式。然而,城市中存在大量不规则(例如自由布局、混合功能区)的建筑分布,这些模式也具有重要的城市分析价值。未来工作可以扩展到对不规则模式的识别和表征。
    • 三维信息的利用: 随着LiDAR和三维模型数据的普及,仅基于二维足迹的分析可能无法完全捕捉建筑模式的全部特征(例如建筑高度、屋顶形态等)。将三维信息融入模式提取,有望提高模式识别的丰富性和准确性。
    • 语义信息的融合: 论文主要依赖几何信息。如果能结合建筑的功能、年代、风格等语义信息,可以进一步丰富模式的描述,例如识别“历史街区模式”或“现代商业区模式”。这需要多源异构数据的融合。
    • 计算效率的进一步优化: 尽管多级图分割已经高效,但对于超大规模城市或动态变化的场景,仍需考虑实时或准实时处理的需求,可以探索分布式计算或硬件加速方案。

相似论文推荐

基于向量语义检索推荐的相关论文。

暂时没有找到相似论文。