抽样误差


概念
  抽样误差(sampling error)
  抽样方法本身所引起的误差。当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。
  抽样误差是指样本指标值与被推断的总体指标值之差。
  主要包括:样本平均数与总体平均数之差;样本成数与总体成数之差。
  统计误差的来源:一类:登记性误差;二类:代表性误差(A、系统性误差;B、偶然性误差)抽样误差特指偶然性误差。
  表示抽样误差的大小,已选择标准误。引起抽样误差的原因
  影响抽样误差的因素:抽样单位数的多少,总体中被研究标志的变动程度的大小。
  抽样误差是抽样理论的一个重要概念,在说明抽样误差之前我们先介绍统计误差。统计误差是指在统计调查中,调查资料与实际情况间的偏差。即抽样估计值与被估计的未知总体参数之差。例如,样本平均数与总体平均数之差;样本成数与总体成数之差等。在统计推断中,误差的来源是多方面的,统计误差按产生的来源分类,有登记误差和代表性误差。
  登记误差又称调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。例如,由于指标含义不清,口径不同而造成的误差;由于被调查者提供不实的资料,以及在登记、计算、抄写上有差错等而出现的误差。这种登记误差不论是在抽样调查还是在其他形式的调查中都有可能产生。调查的范围越广,规模越大,内容越复杂,产生登记误差的可能性就越大。
  代表性误差是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。代表性误差的发生有以下两种情况:一种是由于违反了抽样调查的随机原则。例如,有意识多选好的单位或较差的单位进行调查而造成的系统性误差。可见,只要遵循了随机原则就可以避免产生系统性误差,系统性误差和登记性误差一样,都是抽样组织工作造成的,应该采取措施预防误差发生或将其减小到最低程度;另一种情况是指遵循了随机原则,可能抽到各种不同的样本而产生的随机性误差。随机性误差在抽样推断中是不避免的,是偶然的代表性误差。
  抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。由于总体平均数、总体成数是唯一确定,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是打断总体指标的依据。
  抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。确定其具体的数量界限,并通过抽样设计程序加以控制,因此抽样误差也可以称为可控制的误差。
  影响抽样误差的因素
  ①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。
  ②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。
  ③抽样方法的选择。重复抽样和不重复抽样抽样误差的大小不同。采用不重复抽样比采用重复抽样抽样误差小。
  ④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。