社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

机器学习对公共政策的影响——以城建设计为例

PoIiticaI理论志 • 2 年前 • 274 次点击  

编者荐语:城市图像一直是记录城市发展变迁的重要信息载体,在当前的互联网与大数据时代,随着图片分享网站、社交媒体、街景地图等线上平台的蓬勃发展,可获取的图像数据正在以前所未有的速度增加。同时,来自人工智能领域的机器视觉技术经过40余年的发展取得了大量进展,使对海量城市图像的自动化判别与解析成为可能。而在城市研究领域,由于时间、人力等方面的限制,以往的城市风貌研究很少能够实现对整个城市的精细化全覆盖。在这样的背景下,作者开展了一项结合机器学习方法和城市街景照片对城市建筑形象进行大规模评估的实验性研究。




因公众号推送规则变更

点击标题下方蓝字 关注+星标 “Political理论志” 

不错过社会科学前沿精彩信息哦

具体操作如右 →



基于机器学习的大规模城市环境质量评价方法

摘要

考虑到现代城市目前的规模,大多数人的感知能力无法对每个街角的城市空间质量形成良好的认识。相应地,对于规划者来说,也很难准确回答“城市中哪些地方的自然环境质量最破旧,应该优先考虑更新”、“在快速的城市化进程中,城市面貌是如何变化的”等问题。为了解决这个问题,在本研究中,作者提出了一种计算机视觉方法,该方法包含三个机器学习模型,通过利用最先进的机器学习技术和广泛覆盖的街景图像,对城市环境质量进行大规模和自动评估。作者选择了两个关键变量——建筑立面的施工和维护质量以及街道墙壁的连续性——来进行研究,并将机器得分与从该市56个地点的752名路人现场收集的公共评分得分进行了比较。结果表明,该机器学习模型的建模结果可以被研究人员、规划人员和当地居民以多种方式应用。


作者简介:

Lun Liu 剑桥大学土地经济系

Elisabete A. Silva 剑桥大学土地经济系

Chunyang Wu 剑桥大学工程系

Hui Wang 清华大学建筑系


文献来源

Liu, L., Silva, E. A., Wu, C., & Wang, H. (2017). A machine learning-based method for the large-scale evaluation of the qualities of the urban environment. Computers, Environment and Urban Systems65, 113-125.

本文作者之一 Lun Liu


一、前言


随着城市的发展,其居民和规划者几乎不可能收集到关于每个街角和每个狭窄小巷的完整知识。从理论上讲,人类对城市环境的感知本质上是不完整的、不连续的和扭曲的,正如以往的认知映射和城市形象的研究所描述的那样。考虑到现代城市的庞大规模,情况尤其如此。诸如“城市中哪些地方最难看,应该优先考虑更新”和“在快速城市化的城市中,城市外观是如何变化的”等问题很难回答。


在本文中,我们的目标是在城市环境的物理质量方面探索这种可能性。我们参考了建筑和城市设计理论,并选择了两个物理特征(physical qualities——建筑立面的施工和维护质量和街道墙壁的连续性——在本研究中进行测量。北京是一个快速发展的城市,城市环境非常多样化,被选为案例研究区域。


关于使用街道图像代替实地调查的有效性,已经有一些研究比较了观测实地审计和基于街景图像的审计的结果,并表明它们之间普遍存在一致。然而,这些研究处理的通常是相当客观和直接的变量,如建筑物高度和人行道上障碍物的存在,而我们所看到的物理特征是综合判断。为了验证我们提出的方法的有效性,我们在北京56个地点对752名路人进行了实地调查,并将公众评分得分与机器评分得分进行了比较。我们要探讨的研究问题包括:机器学习模型在基于街景图像判断城市环境物理质量方面的表现如何?是否有可能应用这种方法来替代传统的劳动密集型人工审计?基于图像的机器评分与公众的现场评分之间的相关性如何?


结果表明,我们的机器学习模型在对建筑立面的施工和维护质量进行评级的任务上可以达到0.61的均方误差(MSE)。基于街景图像的机器评价分数与公众的现场评价分数相比,前者的Spearman相关系数为0.66 (p<0.0001),后者的Spearman相关系数为0.71 (p<0.0001)



  二、变量选择:建筑立面品质和街道墙壁的连续性


城市图像一直是记录城市发展变迁的重要信息载体,在当前的互联网与大数据时代,随着图片分享网站、社交媒体、街景地图等线上平台的蓬勃发展,可获取的图像数据正在以前所未有的速度增加。同时,来自人工智能领域的机器视觉技术经过40余年的发展取得了大量进展,使对海量城市图像的自动化判别与解析成为可能。而在城市研究领域,由于时间、人力等方面的限制,以往的城市风貌研究很少能够实现对整个城市的精细化全覆盖。在这样的背景下,我们开展了一项结合机器学习方法和城市街景照片对城市建筑形象进行大规模评估的实验性研究。结合街景照片的内容特点,我们选择了建筑立面品质和街道墙壁的连续性(continuity of street wall)这两项建筑单体和建筑群体层面的关键要素进行了本次评估。


变量1:建筑角度:——建筑立面品质

本分析所衡量的楼级质量是指建筑立面的施工和维护质量。术语“建设和维护质量”更常用于工程背景下。在我们的分析中,我们将这个术语的重点从工程领域转移开来,强调会影响建筑立面最终外观的特定元素。与建筑和维护相关的元素有助于建筑立面的外观包括:

-建筑材料:所使用的材料是否优质、质地优良;

-工业精度和工艺:门面是否精心打造,具有高水平的工业精度和工艺

-维护水平:幕墙是否无裂缝、凸起、构件破损、变质、腐蚀、污垢.和污渍、挂线、杂乱的附件等。

变量2:街道角度——街道墙面的连续性


街墙是指建筑立面沿街道形成的界面。当建筑物直接站在其地块的边缘时,形成了连续的街道墙。更具体地说,连续的街道墙需要以下几点:
1建筑物之间没有“死区”,包括空地、停车场、车道或大型建筑物的后墙;
2没有坚实的空白墙阻挡从街道到建筑物的视线和活动,特别是在中国的背景下,大多数住宅和工作场所都有大门和墙壁包围。然而,如果墙本身是精心设计和视觉上有吸引力的,它也可以被视为一个连续流动的街道界面。

具体操作过程如下:


1以北京五环内为研究范围,以200米间隔抓取了来自百度街景的36万张建筑立面照片。

2)从中随机选取3500张,人工对照片内容进行立面品质和界面连续性打分。

3)根据人工打分训练模型,让机器“学习”人类判断;

4)将训练好的模型应用于全部36万张照片,计算照片中建筑物的立面品质和界面连续性得分,并得到北京五环内各个路段上的平均分值。



变量选择:建筑立面品质和街道墙壁的连续性

   

专家评级经常被用于测量城市环境质量的研究。在这里,判断的方法被认为是衡量品质的一种简单方法。尽管评定量表和这种方法所依赖的分类方法存在主观性因素,但结果值的可靠性通常是可以接受的,在某些情况下,可靠性相当高。理想情况下,应该邀请该领域经验丰富的专家做出判断。然而,考虑到我们研究任务的规模(每位专家需要对数百张图片进行评分),我们很难邀请有经验的建筑师、城市设计师或学者来做这项工作。因此,我们选择招募8名接受过5年以上建筑培训的研究生来完成这项任务。尽管专家评价的有效性得到了他们专业知识的支持,通常没有理由期望他们的评估会与其他此类专业人士有系统的不同,但我们也采取了额外的措施来尽可能减少潜在的偏见。首先,我们与被招募的学生进行了培训和讨论,就每项素质的评分标准达成一致,将对素质的判断与更具体的特征联系起来。其次,我们进行了一次练习,让所有学生对同一组图片样本进行评分,直到大多数情况下他们做出相同的判断。


在计算机视觉领域,有许多图像表示的方法。对于我们的工作,我们评估了三个特征:传统的SIFT直方图和两个最先进的深度卷积网络,即AlexNetGoogLeNet。与传统图像技术以边缘和角等低级特征为主相比,深度卷积网络可以同时捕获局部和高级图像特征。我们使用了两个预训练神经网络的最后一个隐藏层的输出,并为每个场景属性训练了一个支持向量回归(SVR)分类器。标记的数据集被随机抽样到三个子集:训练集、开发集和测试集。对于每个任务,开发集和测试集在每个标记类中均匀随机采样,其余图像用作训练集。例如,对于视觉质量任务,在开发集的四个评分组中每个组随机抽取40个图像,在测试集的每个组中随机抽取60个图像。在模型性能评价方面,我们对分类模型(资质模型和连续性模型)采用F1得分,对施工和维修质量模型采用MSE


案例研究及结果


我们选择北京作为案例研究区域,它经历了从帝都到行政中心的巨大转变,甚至现在,它是全球投资的热点。城市景观是由传统和超现代的购物中心和巨型建筑组成的复杂马赛克。此外,近十年来的快速扩张导致了城市边缘地区存在大量建筑质量差的建筑物,那里的城市景观与市中心的城市景观大不相同。高度多样化的自然环境使北京成为我们分析的一个生动的例子。我们重点研究了五环内的区域,该区域覆盖了大部分建成区。研究区域面积约670平方公里,居住人口约1054万。


我们将整个城市、主干道和街区作为三个层次的分析,从中可以识别出不同类型的模式。例如,在城市尺度上,城市北部总体得分高于南部,尤其是在四环和五环之间的城市边缘地区,视觉质量表现出明显的规律。街景图显示,虽然北四环和北五环之间的大部分地区保持着现代化的城市面貌,但南部的许多地区更像一个破旧的村庄,而不是一个城市。它表明,在城市更新议程中应该更加强调南部城市,这可能涉及一系列措施,从清除立面上的污渍到整体立面改善以及拆除和重建严重退化的结构。例如,关于主要道路,它引起了人们的注意,南北中轴线被认为是古城的遗产,受到了极大的重视,但似乎却没有呈现出一种杰出的建筑视觉品质。相反,东西轴看起来更有视觉吸引力。因此,这表明需要采取更多的措施来制作这个中轴线。在分块层面,可以识别出高分和低分的小集中点。例如,大多数重点开发区域得分高于平均水平,在地图上形成一个暖色热点,这证明了这些区域的造地成功,如CBD和第二CBD。但有些区域由于周围的得分突然下降而显得与周围地区隔绝。在视觉连续性评级方面,在城市尺度上,很明显,北京有很大比例的街道墙壁是不连续的。二环内的历史街区街道采用传统胡同的形式,其得分远高于城市其他地方,这揭示了历史街区的视觉环境与现代发展的主要差异之一。它提醒我们,如果一个城市要保持它的城市特征,不仅是建筑风格,而且这种结构特征也需要被保留。此外,环城道路沿线的街墙由于被认为是城市的门户,一般都比较连续,更加强调街景。总的来说,视觉连续性评级表明需要通过城市规划和设计准则和政策来激励填充式开发,并更加积极地监管“shallow setbacks”(编者注:指的是建筑物与街道或产权界线之间的距离),以便重新建立街道墙的封闭感和吸引力。



、结论与思考


本文的目的是开发和测试一种机器学习方法,该方法包含三个机器学习模型,用于大规模地自动评估城市视觉环境。我们选择了两个关键特征作为出发点:建筑立面的视觉质量和街道墙体的视觉连续性。该方法可以进一步扩展到评价其他塑造视觉体验的建筑环境特征,如建筑风格、建筑规模和相邻建筑之间的关系。通过应用最先进的深度卷积网络,我们可以在专家级数据集上获得令人满意的机器学习性能。在下一步中,我们对公众对建筑环境的看法进行了实地调查,发现机器评级与公众评级之间存在中等到高度的相关性,这表明本方法很好地近似于城市环境中的真实体验。


机器学习方法使城市环境与建筑形象的整体、大规模量化评估成为可能,评估的维度也可由本文所讨论的建筑立面品质和界面连续性扩展到风格和谐度、天际线美观度等诸多方面。随着街景照片和其他城市图像在时间和空间上的积累,这项技术将有可能实现城市风貌的动态监控,以每月或每年更新的方式随时感知建成环境品质变化,为规划设计应对提供数据支持。例如可通过类似方法识别在城市设计方面有待提升的片区,并对其改造紧迫程度进行排序,对城市管理与设计机构决策管控及设计规划提供依据。


但这一交叉领域也面临着不少挑战。首先,虽然机器视觉在某些场景下已实现了与人类视觉相媲美甚至超过人类的表现,但整体而言,这项技术仍然有待提升。此外,对于具有丰富理论与经验体系的城市设计领域,机器视觉对城市图像的评价依据是否具有理论有效性(如机器是否能对构图、韵律、虚实等设计要素做出准确判断),也是有待研究的问题。最后要指出的是,由机器学习方法所得到的结果往往反映的是人们对现有建筑和城市环境的看法,是一种平均性的观念,而突破性、创新性、前瞻性的设计可能往往会被计算机模型给予负面的评价,过于倚重机器评价可能会导致过分强调文化的延续性而非创造性。因此,这类方法在何种情况下适用、何种情况下不适用需要进一步分析,其中有关价值判断的设定更是涉及人文与科技、创新与记忆等问题的辨析,这既是目前机器学习方法可能存在的局限,更是未来值得跨学科深入挖掘的前沿领域。


编译 | 陈姝禾
审核 | 张   涵‍‍‍
终审 | 何升宇‍‍‍

©Political理论志

“在看”给我一朵小黄花

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/158038
 
274 次点击