作者:云落心
链接:https://www.zhihu.com/question/56223861/answer/160750437
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
要讨论内生变量还是外生变量,首先要有系统的观点,其次是要有因果的观点。什么是内生变量(endogenous variable)?那就是:在因果模型或者因果系统中,如果一个变量能够被该系统中的其他变量所决定或被影响,那么就称这个变量为内生变量。只有我们在specify一个因果模型(结果y由一系列影响因子X[x1,x2,…,xn]所决定的)时才对一个变量的内外生性进行判断。如果说一个自变量xj被一个或者多个自变量(包括xj自身)所决定或者影响,那么这个变量就称为内生变量。
纯内生变量是说,这个变量可以系统中的其他变量所完全决定,理论上精确无误。那么这个变量其实也就没用了,可以被其他变量所替代掉。纯内生的变量毕竟少,更多的情况是半内生,半内生变量是说这个变量会被系统中的其他变量所影响,但是不会被完全决定,还有一些系统外未考虑的因素。纯内生和半内生都是内生变量,之所以区别是为了理解因果关系上的差异。
什么是外生变量(exogenous variable)?那就是:在因果模型或者因果系统中,如果一个变量独立于系统中其他所有变量,其他变量的变化不对该变量造成影响,那么就称该变量为外生变量。该系统的外生变量可能由系统外的因素所决定。比如说对解释造糖厂的糖产量的研究系统中,天气就是一个外生变量,但是对于一个研究天气变化成因的系统,天气就是一个内生变量。要注意的是外生变量是独立于其他所有变量,所以其对立面是内生变量和半内生变量。另外如果你在模型中添加了会对外生变量产生影响的变量,那么该外生变量就不再是外生变量了。因果上讲,外生变量是是对因变量的独立的决定因素;统计上讲,外生变量线性独立于其他自变量。举一个造糖厂的例子,假定划定的系统内包含糖产量、天气、害虫、燃料价格等变量。我们可以假设糖产量是就是一个完全的内生变量,认为产量被天气、害虫、燃料价格这些因素完全决定。天气就是一个完全的外生变量,因为糖产量、害虫、燃料价格是不会影响到天气的。而害虫就是一个半内生变量,害虫某种程度是受天气影响的,但是不是被天气完全决定,还受到比如说农药、天敌威胁等外部因素的影响。
OLS模型中的解释:在经典的OLS模型中,假设要求no perfect collinearity,含义就是一个变量不能被其他变量所精确线性表示,讲的就是不能弄一个纯内生变量在里面。假设还要求zero conditional mean,error对自变量X的条件期望是0,也就是error和所有的X都线性无关,无相关性。其实就是保证了error是一个外生变量,包含了所有未添加到模型当中但是对因变量又有影响的变量,而且从全样本来看,这些外生变量对因变量的解释力度为0,因为期望为0嘛。在OLS模型中,自变量是可以线性相关的,只要不是perfect collinearity,也就是说这些自变量可以是半内生变量。但是最好的情况是所有的自变量都是外生变量,error也是外生变量。如果自变量之间线性相关了,就会出现多重共线性,不过参数估计依旧还是无偏的,只是参数的方差会变大。
原创文章,作者:254126420,如若转载,请注明出处:https://blog.ytso.com/276425.html