地理杂谈 | 空间计量模型的应用范式与几个需要注意的问题
2020年第2期《地理学求索》地理杂谈——《空间计量模型的应用范式与几个需要注意的问题》,来自中南财经政法大学经济学院的袁华锡老师。
快跟小编一同了解袁老师精彩的地理人生与科研工作经历,感受袁老师的风范,聆听他的心声,学习在人生路上如何更好的做出选择!
空间计量模型的应用范式与几个需要注意的问题
采访:侯浩然 莫海彤 单位:中南财经政法大学经济学院
学者简介
此前本人之前在B站上做过一些关于空间计量模型的讲座,尚存一些争议,现以讨论性的方式与各位进行再沟通。我倍感压力,也有点紧张。我不会介意大家提出的问题有多尖锐,在此也一定会尽心尽力地将我所了解的内容与各位分享,可能有见解不全面,了解不够深刻的方面,请各位是辩证性的阅读。
本文首先从空间计量模型几个重要的概念展开;其次讨论空间计量研究的标准化范式;再者是空间计量中需要注意的几个问题;再次是使用一个典型案例介绍空间计量模型的论文应该如何组织;最后介绍了空间计量模型的应用方向。
一、几个重要概念
1.1空间滞后模型、空间误差模型和空间杜宾模型
1.2直接效应、简介效应与总效应
空间计量模型计算容易,但解释并不容易。常见的术语有直接效应、间接效应和总效应。直接效应是解释变量对本地的被解释变量的影响。间接效应是解释变量对邻地被解释变量的影响。直接效应与间接效应之间的总和就是总效应。这些效应间还有反馈效应,常规的模型计算可能不够准确,需要对回归结果进行偏微分分解,以体现反馈效应的作用。
二、空间计量分析的一般范式
无论是传统计量还是空间计量,均须先进行理论分析。首先定性分析,这是从理论上将两个事物之间的关系说清楚,让其能为大家所信服与接受。一般使用文字性推导的方法,也有数理模型推导的做法,并可将文字分析和数理推导相结合说明问题。本人反对把模型复杂化、算法复杂化。论文要能被大众所接受,并产生好的经济社会效应。通常来说,文字性推导中的常见问题是写大白话,缺乏经典文献和事实支撑,自说自话难以令人信服。如果理论上不成立的话,定量分析只是伪相关。所以,定量分析一般的套路是:1)空间权重矩阵的构建;2)对变量进行空间自相关检验。关于是对所有变量都做检验还是只对核心变量做检验这个问题,本人认为是可以做则全做,至少要确保核心解释变量具有空间相关性;3)选择空间计量模型。具体选择哪一种要进行严格的统计模型检验,有多种检验方式可以使用;4)估计空间计量模型。估计的结果有些会有偏差,需要额外的处理。
另外,具体的模型选择,偏微分效应的分解等操作,在此给大家提供几个链接,请大家查阅。
针对空间计量软件的选择,可以选择Matlab,Stata和R。个人建议最好使用Matlab,此外也推荐给大家一些Stata的命令,供各位参考。
三、需要注意的几个问题
在空间计量分析中,几个需要注意的问题包括滥用空间计量模型、缺少必要的统计检验和强行使用空间计量模型。首先,由于空间计量模型这两年比较好发文章,有些文章不管什么变量强行利用空间计量模型。应该从理论上证实这些变量间有空间效应,要有定性的判断,才可以用进一步的定量计算;其次,一些文章缺乏必要的统计检验,一上来就是空间计量模型的回归结果。一定要遵循一般的计量学范式,并参考权威文献。此外,内容与形式同样重要,即论文排版要规范。例如,中文论文一般使用1.5倍行距,英文论文一般使用2倍行距等格式要求都须严格遵守。
四、案例分析
在此用一个简单案例展示空间计量模型的论文应该如何组织。文章是研究制造业集聚与绿色经济效率之间的关系。大家想详细了解的话可以下载这篇文章,数据和代码均已刊出,大家可以下载学习。
首先需要写出模型,如图所示:
然后构造空间权重矩阵,形成一个嵌套矩阵,如图所示:
接着,做空间自相关检验,个别变量或者个别年份不显著是没有关系的,不强求所有变量所有年份都显著。
在空间计量模型的选择方面,需通过检验进行判断。
空间计量模型估计结果如下图。可以看出,制造业的集聚会抑制绿色经济效率。
最后做空间效应分解,即使用各种矩阵进行稳健性效应分析。
五、应用方向
空间计量模型的应用方向一是空间矩阵的复杂化。即不仅考虑地理因素,还需考虑更多因素如社会经济因素。二是动态空间计量与空间衰减边界的计算。讨论空间溢出效应范围有多大,什么时候停下来等问题;三是在空间变异系数模型方面的拓展。目前多使用的是空间常系数模型,是一种全局的,整体性的模型。典型的方法是GWR和GTWR(同时考虑到时间与空间效应),对GTWR方法的使用主要依赖ArcGIS,香港中文大学黄波教授开发有相关的插件可以下载使用。
互动问答
问题一:多个空间权重矩阵怎么取舍,看到有些文章会用到几个空间权重矩阵?
无论用哪个矩阵,按照标准的范式把它做下来,有一个是基础性的分析结果,其他的作为一种对比的稳健性检验。
问题二:东西经、南北纬度有一个数字重合的问题,怎么解决?
这个问题是一个全球尺度的研究中遇到的问题,目前还不清楚跨国尺度上这个数值问题怎么解决。
问题三:什么情况下需要偏微分分解?
有反馈效应的模型才需要进行偏微分分析。
问题四:如何选择空间计量模型?
先判断用哪个空间计量模型,再判断用哪个效应。也可以反过来应用。
问题五:固定效应与动态效应的应该选择哪个?
从理论推导中判断。
问题六:短期效应与长期效应有什么区别?
短期效应就是从短期来看会怎么样,长期效应就是长期来看会怎么样。
问题七:使用空间计量模型最好30个样本以上么?
空间计量模型要严格遵循非空间计量模型的假设,包括统计假设、计量假设等。样本低于30个效果可能不是那么好,尽可能规避这些问题。
问题八:空间计量模型的内生性问题
现在的空间计量模型都存在内生性问题,解决的方法与传统计量模型解决内生性的方法一样,如工具变量回归等,这方面有一些很好的参考文献。
问题九:用不同的空间权重矩阵是不是代表不同的涵义?
是的,不是盲目用复杂的矩阵,要以理论推理为基础。
问题十:GWR的残差通不过相关性检验
尽量要通过残差检验。
问题十一:如何选取合适的解释变量?
与传统的计量方法一个思路,从理论基础上选取合适的解释变量。通常在统计学方法上有逐步回归,相关统计来筛选解释变量
问题十二:Matlab的输出结果的整理?
这是Matlab相较于Stata不那么方便的一点可以把结果储存到Matlab的表里,然后自己整理。
问题十三:对不同模型的结果的系数进行对比应该怎么做?
严格地说,不同模型之间的系数是无法直接对比的,需要做边际效应分析,对系数进行调整。在不严格的情况下,可以直接对比。
问题十四:相关性检验结果均不显著,是不是没有空间效应?
是的。