异方差性


  异方差性(heteroscedasticity )是为了保证回归参数计量具有良好的统计性质,经典线性回归模型的一个重要假定是:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,则称线性回归模型存在异方差性。
  若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数计量不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数的进行有关显著性检验。
  对存在异方差性的模型可以采用加权最小二乘法进行估计。
  异方差性的检测——White test
  在此检测中,原假设为:回归方程随机误差满足同方差性。对立假设为:回归方程随机误差满足异方差性。判断原则为:如果nR^2>chi^2 (k-1), 则原假设就要被否定,即回归方程满足异方差性。
  在以上的判断式中,n代表样本数量,k代表参数数量,k-1代表自由度。chi^2值可由查表所得。

异方差性的含义

  回归模型的随机扰动项ui在不同的观测值中的方差不等于一个常数,Var(ui)= 常数(i=1,2,…,n),或者Var(u ) Var(u )(i j),这时我们就称随机扰动项ui具有异方差性(Heteroskedasticity)。
  在实际经济问题中,随机扰动项ui往往是异方差的,但主要在截面数据分析中出现。
  例如
  (1)调查不同规模公司利润,发现大公司利润波动幅度比小公司利润波动幅度大;
  (2)分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。
  在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;图5-1显示了一元线性回归中随机变量的方差ui随着解释变量 的增加而变化的情况。
  异方差性破坏了古典模型的基本假定,如果我们直接应用最小二乘法估计回归模型,将得不到准确、有效的结果。

异方差性的来源

  1.模型中缺少某些解释变量,从而随机扰动项产生系统模式
  由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。
  例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装食品等)的需求,设其模型为:
  (5-1)
  其中Qi表示对某一消费品的需求量,Ii为家庭收入ui为随机扰动项。ui包括除家庭收入外其他因素对Qi的影响。如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得Qi偏离均值的程度。在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平IiQi偏离均值的程度是不同的,Var(ui) 常数,于是就存在异方差性了。
  再比如,以某一时间截面上不同地区的数据为样本,研究行业产出随投入要素的变化而变化的关系,建立如下模型:
  (5-2)
  其中Yi表示某行业产出水平。Li表示劳动力对产出的影响。Ki表示资本产出的影响,ui表示除劳动力和资本外其他因素对产出水平的影响,诸如地理位置、国家政策等。显然,对于不同的行业 ,这些因素对产出 的影响程度是不 同的,引起 偏离零均值的程度也是不同的,这就出现了异方差。
  异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。
  2.测量误差
  测量误差对异方差性的作用主要表现在两个方面:一方面,测量误差常常在一定时间内逐渐积累,误差趋于增加,如解释变量X越大,测量误差就会趋于增大;另一方面,测量误差可能随时间变化而变化,如抽样技术或收集资料方法的改进就会使测量误差减少。所以测量误差引起的异方差性一般都存在于时间序列中。
  例如,研究某人在一定时期内学习打字时打字差错数Yt与练习打字时间Xt之间的关系。显然在打字练习中随时间的增加,打字差错数将减少,即随着Xt的增加Yt将减小。这时Var(ut)将随Xt的增加而减少,于是存在异方差性。
  不仅在时间序列上容易出现异方差性,利用平均数作为样本数据也容易出现异方差性。因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同,一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即Var(ui)随收入Ii呈现先降后升的趋势,这也存在着异方差性。
  3.模型函数形式设置不正确
  模型函数形式的设定误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势
  4.异常值的出现
  随机因素的影响,如政策变动、自然灾害、金融危机、战争和季节等。

异方差性的类型

  异方差一般可归结为三种类型:
  (1)单调递增型: 随X的增大而增大,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越大
  (2)单调递减型: 随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越小
  (3)复杂型: 与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。

异方差性的后果

  在古典回归模型的假定下,普通最小二乘估计量是线性、无偏、有效估计量,即在所有无偏估量中,最小二乘估计量具有最小方差性——它是有效估计量。如果在其他假定不变的条件下,允许随机扰动项ui存在异方差性,即ui的方差随观测值的变化而变化,这就违背了最小二乘法估计的高斯——马尔柯夫假设,这时如果继续使用最小二乘法参数进行估计,就会产生以下后果:
  1.参数计量仍然是线性无偏的,但不是有效的
  2.异方差模型中的方差不再具有最小方差性
  3.t检验失去作用
  4.模型的预测作用遭到破坏