估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

之前,推荐过“必须使用所有外生变量作为工具变量吗?”,但觉得里面没有说的很清楚,因此,今天在社群群友要求下重新推荐一下这个问题。一些相关的知识如下:1.2SRI还是2SPS, 内生性问题的二阶段CF法实现,2.控制函数法CF, 处理内生性的广义方法,3.2SRI还是2SPS, 内生性问题的二阶段CF法实现,4.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!5.Heckman两步法是什么? 及其内生性问题?
有人提出了以下问题
正在估计一个方程:
Y = a + bX + cZ + dW
然后用Q作为W的工具变量。知道第一阶段的回归应该是
W = e + fX + gZ + hQ
(即在第一阶段中使用所有外生变量)。实际上,如果使用ivregress 命令,这个步骤都是自动完成的 。但是,若只想在第一阶段使用Q而不用X和Z作为W的工具变量。有什么办法可以在Stata中做到呢?此时,可以用W对Q做回归并获得W的预测值,然后将其用于第二阶段回归。不过,也有一个问题,那就是这时获得的估计标准误并不正确。
ivregress不会让你这样做,而且,如果你相信W是一个系统的一部分,是内生的,那么就必须同时包括 X和Z 作为W的工具变量,否则会得到有偏差的b、c和d估计值。
考虑如下模型系统:
Y1 = a0 + a1Y2 + a2X1 + a3*X2 + e1(1)

  Y2 = b0 + b1*Y1 + b2*X3 + b3*X4 + e2(2)

注意:假设正在估计结构方程式(1);如果 X1和X2 是外生的,则必须将它们作为工具变量,否则你的估计将有偏差。在一般系统中,当内生变量的工具值出现在方程中时,此类外生变量必须用作任何内生变量的工具变量,其中外生变量也出现在方程中。
考虑一下上述两个方程的简约形式:
Y1 = e0 + e1X1 + e2X2 + e3X3 + e4x4 + u1(1r)

  Y2 = f0 + f1*X1 + f2*X2 + f3*X3 + f4*x4 + u2(2r)

其中e#和f#是(1)和(2)方程中的a#和b#系数的组合,而u1和 u2是e1和e2的线性组合 。
对于一个内生变量,所有外生变量都出现在他的方程中。这是联立系统的特性,因此估计效率(estimation efficiency)要求将所有外生变量都包括在内,以此作为每个内生变量的工具变量。
这是真正的问题。看式(1):Y2的简约形式方程 (2r)清楚地表明, Y2与X2相关 (通过系数 f2)。如果不将X2包括在Y2的工具变量中 ,那么将无法考虑Y2的工具值与 X2的相关性。由于没有考虑这种相关性,因此当使用Y2的工具值估计式(1)时,将迫使系数 a3去考虑这种相关性。这种方法将导致a1和a3的估计偏差。
可以参考一下Baltagi(2011)。请参见2SLS的整个讨论,尤其是第265页上的方程11.40之后的段落。(不知道为什么在其他书中不强调此问题。)
当不包含X4就只会影响估计效率,而不会影响偏差。
但是,在一种情况下,不必包括X1和 X2作为Y2的工具变量 。也就是说当系统为递归形式时 Y2确实不 依赖于Y1,考虑到两个方程的扰动项之间的相关性,因此有理由相信它是弱内生性的。仍然可以在这里进行ivregress的操作,并保留X1和X2作为其工具变量。但是,值得注意的是,这里不再要求使用他们作为工具变量。然后,可以只需从第一阶段就对工具变量的预测值做回归即可。
如果使用间接最小二乘法,则必须自己对协方差矩阵进行调整。考虑如下结构方程:
y1 = y2 + x1 + e
其中,工具变量为z1, 且你不认为 y2是y1的函数 。
以下示例仅将 z1 用作y2的工具变量。首先,在y1,y2, x1和z1上创建一个数据集 :
估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

现在,我们执行第一阶段回归并获得对工具变量的预测值,这对于方程右边的每个内生变量都必须执行。
估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

现在通过应用正确的均方误差来校正方差-协方差:
估计工具变量回归时, 是否必须将所有外生变量用作工具变量?

Reference

  • Baltagi, B. H. 2011.

  • Econometrics. New York: Springer

Source: https://www.stata.com/support/faqs/statistics/instrumental-variables-regression/

关于工具变量

1.内生性问题操作指南, 广为流传的22篇文章,2.看完*期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析,34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于*外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书,37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具! 38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差,41.内生性处理的秘密武器-工具变量估计,42.工具变量IV必读文章20篇, 因果识别就靠他了,43.看完*期刊文章后, 整理了内生性处理小册子,44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题,47.非线性面板模型中内生性解决方案,48.内生性处理方法与进展,49.内生性问题和倾向得分匹配,50.你的内生性解决方式out, ERM独领风骚,51.面板数据是怎样处理内生性的,52.计量分析中的内生性问题综述,53.一份改变实证研究的内生性处理思维导图,54.Top期刊里不同来源内生性处理方法,55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法,57.二值选择模型内生性检验方法,58.2SRI还是2SPS, 内生性问题的二阶段CF法实现,59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的*评述!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

上一篇:【论文】Awesome RelationExtractionPaper(关系抽取)PART IV


下一篇:「刷题笔记」数学IV