如何进行负二项回归分析?

如果研究X对于Y的影响,Y是计数资料,一般可以使用Poisson回归进行研究。但是Poisson回归要求数据满足等离散现象(平均值与方差相等),如果说数据具有一定的聚焦性,此时很可能就会产生过离散现象,即数据平均值与方差明显不相等。此时使用负二项回归更为科学。

比如研究传染病人数,传染病人数明显具有一些空间聚焦现象;以及专利数量,很可能企业之间存在着某种空间意义上的竞争,导致数据具有聚焦现象,诸如此类数据其并不满足Poisson分布的独立性原则。此类数据通常情况下方差会明显的大于平均值,属于过离散数据,此种数据在进行Poisson回归时会导致模型参数估计值的标准误偏小

因而,如果计数资料不适合Poisson分布时,尤其是数据过离散时,此时使用负二项回归分析更合适。

1、案例背景

当前有一项针对专利数量的影响关系研究,研究政府对于企业的支持力度,是否一线城市,对于企业专利数量的影响情况。共收集10个城市的数据,如下:

X1是否一线城市:数字1表示为一线城市,数字0表示非一线城市
X2政府扶持力度:数字越大表示对于企业申请专利时的扶持力度越大
Y专利数量:数字表示某城市调研所有企业申请成功的专利数量
Weight企业数量:数字表示某城市调研的企业数量

2、理论

关于过离散的检验有很多检验方法,在SPSSAU系统中可有三种方式进行综合判断,分别如下:

  • 如果说描述分析时发现平均值与方差值有着较大的差异,则说明负二项回归较合理,如果说平均值与方差值基本相等,说明可能使用Poisson回归较为合适。

  • 过离散现象可通过O检验(在Poisson回归分析时SPSSAU默认有提供)

  • 过离散现象的检验可针对alpha值进行检验,在负二项回归时默认输出,如果alpha值显著不为0(对应的P值小于0.05),则说明使用负二项回归较为合理,反之则说明可能使用Poisson回归较优。

3、操作

登录SPSSAU,选择【实验/医学研究】--【负二项回归】。

本例子中专利数量是基于'Weight企业数量’,因此'基数Eposure【可选】’框中应该放入'Weight企业数量’这项,如下图:

4、SPSSAU结果分析

(1)过度离散检验

在进行负二项回归之前,专利数量的平均值是56.500,方差是2480.944,明显平均值与方差不相等,存在过离散现象。而且使用SPSSAU的Poisson回归时,对其提供的O检验发现,O值明显大于1.96(p=0.000 <0.05),拒绝等离散假定,说明数据存在明显的过离散现象,因此使用负二项回归较为适合。

(2)负二项回归模型似然比检验

SPSSAU共输出两个表格,分别是“负二项回归模型似然比检验”,“负二项回归分析结果汇总”。 “负二项回归模型似然比检验”是针对整个模型的检验,如果说模型p值小于0.05,意味着放入自变量更优,即模型有意义。“负二项回归分析结果汇总”是回归结果的具体结果。

模型似然比检验用于对整体模型有效性进行分析。

第一:首先对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效;

第二:AIC值和BIC值可用于多次分析模型时的对比;此两个值越低越好;如果多次进行分析,对比该两个值的变化情况,综合说明模型构建的优化过程;

首先对模型整体有效性进行分析,模型检验的原定假设为:是否放入自变量(X1是否一线城市, X2政府扶持力度)两种情况时模型质量均一样;检验p值为0.000小于0.05,因而说明拒绝原定假设,即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。

(3)负二项回归分析结果汇总表

从上表可知,将X1是否一线城市, X2政府扶持力度共2项为自变量,而将Y专利数量作为因变量进行负二项回归分析,从上表可以看出,模型公式为:Log(Y)=-10.316 + 0.213*X1是否一线城市 + 0.680*X2政府扶持力度 + ln(Weight企业数量)。模型的伪R方值(McFadden R 方)为0.196,说明研究模型可以解决专利数量19.6%的原因。

具体分析可知:

X1是否一线城市的回归系数值为0.213,但是并没有呈现出显著性(z=0.462,p=0.644>0.05),意味着X1是否一线城市并不会对Y专利数量产生影响关系,即城市类别与专利数量无明显关系。

X2政府扶持力度的回归系数值为0.680,并且呈现出0.01水平的显著性(z=6.490,p=0.000 <0.01),意味着X2政府扶持力度会对Y专利数量产生显著的正向影响关系,以及优势比(OR值, exp(b)值)为1.973,意味着X2政府扶持力度增加一个单位时,Y专利数量的增加幅度为1.973倍。

「更多内容搜索SPSSAU了解」

(0)

相关推荐

  • 「发生次数」用什么方法搞定?:泊松回归与负二项回归。

    转自个人微信公众号[Memo_Cleon]的统计学习笔记:"发生次数"用什么方法搞定?泊松回归与负二项回归. 关于泊松回归,还有一些问题需要再进一步地说明与示例. 交叉表实际上是经 ...

  • 起点的轻小说和科幻适合新人吗?|| 玄派数据分析

    今天给大家带来的,就是2019年,起点男频轻小说和科幻频道的趋势分析. 之前年中数据盘点的时候就有发现--在都市和玄幻之下,科幻和二次元分类的数据也是不错的,竞争力适中. 2019起点小说哪一类热门? ...

  • Poisson回归,研究离散事件的重要回归方法

    第二篇 Poisson分布,中文一般翻译为泊松分布,通俗来说,指的是在一个极大人群.空间和时间范围内,观察对象某种现象发生数的分布. 比如,2020年浙江省某县区3000名新生儿中,有20例先神经管畸 ...

  • 为什么鸠摩智学打不赢虚竹?他会了小无相功、少林寺七十二项绝技

    作者:萨沙 本文章为萨沙原创,谢绝任何媒体转载 萨沙一本正经的胡说八道第143期 为什么鸠摩智学打不赢虚竹?他会了小无相功.少林寺七十二项绝技 很多人很奇怪,虚竹的内力主要来自无崖子,另一部分来自李秋 ...

  • 练太极获得气感的“十二项”要领!

    拳歌 虚灵顶劲,气沉丹田:沉肩坠肘,腰胯放松. 气贴脊背,节节贯穿:以意领气,以气运身. 运劲平稳,定式深沉:阴阳开合,虚实分明.  几百年来,太极拳的先哲及大师们对太极拳的各种练习方法及要领有太多的 ...

  • 互助问答第472期:关于DID和负二项回归的问题

    关于DID和负二项回归的问题 各位老师好:       我的问题是,我目前在做有关DID方法的实证研究,运用的软件是stata,目前学到的方法是用reg或xtreg命令与treated*t的交互项来实 ...

  • 混职场专业不一定最优秀,但这二项技能千万要具备

    很多人认为,进入职场,当了个小白,那我只要专业技术OK就行了,其他与我无关. 如果你只想当个小白.小主管,那没问题,你只需要具备本职工作的专业技能就可以了,其它事少操心. 但,人在职场,不进则退,不是 ...

  • 练习R:glm()函数连续自变量的二项logistic回归

    用<谁说菜鸟不会数据分析SPSS篇>的续约数据,收集到各商户id,注册时长.营业收入.成本数据以及合作续约的情况,用R实现连续自变量的二项logistic回归. 因变量是否续约,自变量包括 ...

  • 安全生产的十二项治本之策

    (一)制定安全发展规划,建立和完善安全生产指标及控制体系; (二)加强行业管理,修订行业安全标准和规程; (三)增加安全投入,扶持重点煤矿治理瓦斯等重大隐患; (四)推动安全科技进步,落实项目.资金; ...

  • 手把手教你用Python构建logit、负二项回归、决策树与随机森林机器学习模型

    本次更新的主要内容为利用Python中的statsmodels库构建logit与负二项回归模型,以及利用sklearn库构建决策树以及随机森林模型.内容源自同济大学研究生课程<高级数理统计> ...

  • 交易系统需要查探的十二项内容

    证券市场中,对上任何一次交易,谁都无法保证能够百分之百的成功.交易制胜的关键在于: 你的胜算率(获胜的概率)是不是够高 ?(胜算率最低,总体也不得低于 51%  .) 你的盈亏比(比值)是不是够大 ? ...

  • 优秀物理治疗师的十二项素质

    By admin November 3, 2019 News 优秀物理治疗师的十二项素质   物理治疗师有助于恢复,维持和促进患者的最佳身体健康.要成为最佳的物理治疗师应考虑多种特质.本文将探讨一名优 ...