技术前沿 | 面向场所和数据流的同区位模式分析工具集

导言

同位模式(Colocation pattern)是GIS中重要的空间模式,它是指不同类型的地理事物频繁地在相邻的位置出现。通常,将地理事物抽象为空间点要素,然后采用各种同位模式分析模型识别要素中存在的同位模式和关联规则。更确切地讲,同位模式应该翻译为同区位模式,区位更能够准确表达Colocation pattern的内涵。目前,尽管同位模式的算法和实现工具相对较少,同位模式作为一种空间关联规则分析的方法论,也没有像其它空间关联分析(Spatial Association Analysis),如空间自相关那样受到广泛关注,但其学术价值和应用潜力越来越受到人们的重视。

正如同位模式科普文中介绍的那样,空间同位模式源于信息科学中的频繁项集,是频繁项集在地理学中的扩展及其应用,也是地理学思维融合到计算机数据挖掘算法中的经典案例。它可以解决诸如从城市数百种餐馆中识别出哪些类别的餐馆总是频繁地出现在一起的问题,即兰州拉面和沙县小吃、肯德基和麦当劳总是一起出现等现象。在实际应用中,它也可以是任何具体的设施,或者其它具体或抽象的地理事物。标志性的空间同位模式分析算法由华人地理学者熊辉、黄燕等提出,国内中南大学邓敏教授团队、武汉大学艾廷华教授等学者团队也为此作出了重要贡献。王法辉教授团队的显著性同位模式挖掘模型被ESRI官方集成到了新一代的ArcGIS Pro桌面平台中。近年来,南京师范大学汤国安教授团队构建了面向OD流数据的同位模式识别方法,实现了从传统场所同位模式到地理流同位模式的方法扩展。汤国安教授团队在ArcGIS Pro中实现了传统场所同位模式和地理流同位模式的模型工具集。下面具体介绍这两个工具的使用方法。

01

模型操作案例

1.1

基于场所的全局同位模式分析

案例场景描述:图1为某城市片区中所有的餐馆POI数据,数据属性中包含了每个餐馆所属的类别字段“T2”,“T3”字段为更细类别的分类,如图2所示。就如“啤酒和尿布”,“肯德基和麦当劳”那样的发现,在数十种类型中,是否也存在某些类别的餐馆具有同位模式规律。通过“基于场所的全局同位模式分析工具”分别探测字段“T2”和“T3”中存在同位模式的餐馆类型组。餐馆POI数据文件为“餐饮POI.shp”。

图1 某城市片区餐饮服务POI数据

图2 餐饮服务POI数据中的类别字段

1) 打开所提供的【同位模式挖掘工具箱】中的【基于场所的全局同位模式分析工具】,如图3所示。配置【输入点要素】为“餐饮POI”点图层;“邻域”字段设置为“200”,邻域指为了将附近一定范围内的要素标定为该点要素的邻域要素所设置的搜索范围;【类别字段】设置为“T2”,支持度和置信度分别设置为0.80.6,其中支持度即满足同位模式的最低阈值,而置信度是指满足空间关联规则的最低阈值,由用户根据自己的分析目标确定;最后配置【输出结果工作空间】,用于存储同位模式和关联规则的分析结果表。完成后运行工具。

图3 基于场所的全局同位模式分析工具界面

2)运行完成后,会在输出结果工作空间中生成同位模式分析结果表和关联规则分析结果表,名称分别为“餐饮POI_colocationTB”和“餐饮POI_associationTB”,分别如图4和5所示。

图4 全局同位模式结果

图5 空间关联规则结果

全局同位模式和关联规则并不适合于在地图上可视化。从图4可以看出,快餐厅、糕饼店和中餐厅在0.8的支持度下表现为同位模式。这也意味着快餐厅、糕饼店和中餐厅两两之间也彼此表现为同位模式,其它模式的内涵与之类似。从图5中第17条记录可以看出,至少糕饼店和快餐店的旁边大概率会有中餐厅。但相反,中餐厅旁边不一定有非常大的概率存在糕饼店或快餐店,这需要查看其它行中的关联规则加以确定。

采用与步骤1类似的方式,保持其它参数不变,仅将“T3”字段作为【类别字段】,从更加细分的餐馆类别中挖掘隐含其中的同位模式和关联规则。很遗憾,在0.8的支持度阈值下,诸如肯德基和麦当劳等具体类别并没有表现为同位模式,如果阈值设置得更小,剔除“餐饮相关”等类别,则可能会出现这些餐馆的同位模式现象。这里仅为了演示该模型的使用方式,其它细节和分析不再赘述。

1.2

基于流的全局同位模式分析

案例场景描述:OD流数据可以是实体流,如人流、物流和信息流等,也可以是语义流,如表现两个区域或场所之间某种逻辑关系的具有方向的流。如图6所示为通过某个属性值区分开来的三种OD流。对于某个OD流单元,当其它任何一个OD流与之同时满足起点彼此邻近,终点也彼此邻近的条件时,则认为这两个流单元彼此邻近。如果要从中发现隐含的同位流模式和流关联规则,则可以通过提供的另一个工具实现。流数据文件名称为“GeoFlows.shp”。

图6 OD流数据

尽管基于点要素的同位模式和基于OD流要素的同位模式算法逻辑有所差异,但工具应用逻辑在两个工具上实现了统一,即使用方式和配置参数类似。如图7所示为参数配置结果。需要注意的是,这里的支持度设置较低,是因为流数据是构建的虚拟数据集,或者通常称之为人工数据集,此数据同位不显著,只有将支持度阈值设置地较低时,才能提取出同位模式。实际应用中,需要根据数据情况和分析目标设定阈值大小。

图7 基于场所的全局同位模式分析工具界面

02

模型应用场景

同位模式是GIS中用于空间模式挖掘的一种重要方法,可以在很多自然地理和人文地理问题中使用。例如,在犯罪地理学中,地理学者可以探测发生盗窃案的热点区域与周围多种环境要素之间是否存在同位模式,以寻求促使盗窃案发生的环境因素;在交通地理中,学者们可以使用同位模式分析模型探索高发事故点与周围要素之间是否具有同位模式,从而确定导致事故发生的因素;在地貌学中,可以用于分析不同地形特征要素之间的关联模式,从而确定不同特征要素之间是否存在同位模式或关联规则;再比如旅游地理学中,可以有效分析城市中的星级酒店与一般酒店是排斥关系还是共生关系。然而,同位模式的应用场景远不限于此,它的应用场景和应用潜力,完全取决于您的想象力。

03

模型未来展望

尽管学者们提出了大量的同位模式及其关联规则分析算法和模型,也开展了大量应用研究,但就目前而言,同位模式的可用软件开发包和软件工具非常少;此外,现有的大多数算法和模型都属于全局同位模式,而部分局部同位模式算法缺陷明显,尚没有非常有效的局部同位模式分析模型,需要地理信息学者们继续努力!

算法工具与练习数据地址:

https://github.com/gissuifeng/colocatoin_flow_pattern

【新地理学人】

撰文 | 文里

排版 | kinks

图片 | 文里

欢迎讨论:neogeographer@163.com

(0)

相关推荐