互助问答第473期:关于全球数据库的国家匹配问题问题

关于全球数据库的国家匹配问题

尊敬的老师,我想请教下,在用全球数据的多个数据库时,发现各个数据库国家名称不匹配的很多(比如世界银行和战争相关数据库),请问有没有什么技术性解决方法?还是说国家code是全球通用的,是我其他操作有问题?

我的理解是,数据本身总是要清理的,几乎不可能拿过来直接就用,国家这种变量已经算比较清楚的了。可以按照某一个dataset里的国家名称,然后其他的都对应过去,也可以所有的都对应到一个通用标准上(比如,alpha 2 两个字母的国际标准国家代码 / alpha 3 三个字母的国际标准国家代码等等)。国家不匹配我想一个是因为名字的写法多样(比如China / PRC),一个是国家/成员有时候定义比较tricky(举个不那么政治的例子,英格兰是足球世界杯的参赛球队,不是英国),另外在一个时间段内,国家也是会变的,虽然变得不多(就好比中国市一级的区划有时候也是变化的)。

(0)

相关推荐

  • 蚂蚁金服自研数据库OceanBase拿下榜单第一,Oracle会不会服?

    10月2日,全球最权威的数据库性能排行榜TPC-C公布最新性能测试结果,中国企业自研的分布式关系型数据库OceanBase创造了新的世界纪录,将Oracle 保持了九年的世界记录提升了2倍多. Oce ...

  • 亲,你的KB会QA吗?

    卷友们好,我是rumor. 今天和大家聊聊我又爱又恨的主线剧情--对话. 除了搜广推之外,NLP最大最核心的落地点就是对话了.对话场景下又可以分为闲聊.任务型和FAQ三类任务.闲聊就不说了,做一个凉一 ...

  • 全球疫情什么时间能结束?权威数据库给出推算,至少需要7.4年

    目前新冠疫情仍然在全世界范围内肆虐,经过一年时间的发酵,疫情不仅没有减轻,反而有愈演愈烈的趋势,甚至不少国家都出现了变异病毒,让疫情的防控更加困难,为了防止疫情的扩散,不少国家采取了非常严格的措施,诸 ...

  • 年轻人消费行为道德标准差距大

    Z世代是美國及歐洲的流行用語,意指在1990年代中叶至2000年后出生的人.在短短十多年的时间内,Z世代将占全球所有买家的三分之一.咨询公司OC&C Strategy Consultants最 ...

  • 互助问答第484期:关于DID样本时间选择的问题

    关于DID样本时间选择的问题 请问DID的样本时间起码要选事件发生前的多少年呢?如果是事件发生当年开始算可以吗? 一般3~5年,具体事件发生当年还是滞后的一年算,要根据具体的政策来看.

  • 互助问答第483期:关于控制变量选择的问题

    关于控制变量选择的问题 想请教下关于控制变量选择的问题.第一个回归我加了三个控制变量,第二个根据已有的文献我又加入了人口密度.但是回归的结果显示,人口密度加进去好像没什么意义,感觉显著性好像没那么强, ...

  • 互助问答第482期:关于边际效应描述的问题

    关于边际效应描述的问题 老师好,我想问问关于边际效应的系数怎么描述呢? 需要具体看你的变量如何度量,你参考一下文献中类似的度量来描述.

  • 互助问答第485期:关于定序变量的问题

    关于定序变量的问题 请问老师定序变量当自变量可以当数值变量放到回归模型中吗,1到4的定序,比如公平1-4越大越公平,在自变量里可以直接当数值放还是必须需要让非常不公平的那个做参照组. 可以直接放,很多 ...

  • 互助问答第486期:把logit的结果代入到DID问题

    把logit的结果代入到DID问题 请问老师,公式6是用logistics模型来估计政策执行概率,然后把政策执行概率代入到公式7DID中,该怎么把logit的结果代入到DID中呢? logit估计后生 ...

  • 互助问答第487期:关于剔除样本的问题

    关于剔除样本的问题 请问什么时候需要剔除样本呢?某指标连续2-3年缺失数值,可以直接空着,还是得删除这几年的样本呢? 你的问题没有标准答案,需要根据你具体情况来定,如果只是一两个指标,两三年的数据缺失 ...

  • 互助问答第488期:关于控制变量和R方的问题

    关于控制变量和R方的问题 把一个控制变量剔除之前,R方大 但解释变量不显著:去掉一个控制变量后,解释变量显著,但R方只有0.12.请问该怎么办呢? 目前对r2的关注没有以前那么看重.

  • 互助问答第489期:关于DID异质性分析的问题

    关于DID异质性分析的问题 我在做多期双重差分异质性分析,即政策对不同城市级别影响的差异性.看了一些文献,选用了因变量=a+b改革变量*城市级别虚拟变量+c控制变量+个体固定效应+时间固定效应+误差项 ...

  • 互助问答第481期:关于GMM的问题

    关于GMM的问题 请问GMM回归时,Hansen检验0.217,  AR(1)拒绝原假设, AR(2)接受原假设,核心解释变量符号方向都是对的,但是核心解释变量的P值均不显著.此种情况下,应该考虑如何 ...