中心极限定理

什么是中心极限定理
  大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量平均数是以正态分布为极限的。
  中心极限定理是概率论中最著名的结果之一。它提出,大量的独立随机变量之和具有近似于正态的分布。因此,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么有很多自然群体的经验频率呈现出钟形(即正态)曲线这一事实,因此中心极限定理这个结论使正态分布数理统计中具有很重要的地位,也使正态分布有了广泛的应用。
中心极限定理的表现形式
  中心极限定理也有若干个表现形式,这里仅介绍其中四个常用定理:
  (一)辛钦中心极限定理
  设随机变量tp://wiki.mbalib.com/w/images/math/f/3/8/f38693c97712b087dd6232107aabc912.png" alt="x_1,x_2\cdots,x_n">相互独立,服从同一分布且有有限的数学期望a和方差σ2,则随机变量tp://wiki.mbalib.com/w/images/math/3/5/c/35c98a1c45ddb1cc56b66236d3abd509.png" alt="\bar{x}=\frac{\sum x_i}{n}">,在n无限增大时,服从参数为a和tp://wiki.mbalib.com/w/images/math/7/5/8/758969c18beb0777a9b5ad46f7040eb2.png" alt="\frac{\sigma^2}{n}">的正态分布即n→∞时,
  tp://wiki.mbalib.com/w/images/math/4/9/2/4923a2ca9bd0bf99cba82446c91d265e.png" alt="\bar{x}~N(a,\frac{\sigma^2}{n})">
  将该定理应用到抽样调查,就有这样一个结论:如果抽样总体的数学期望a和方差σ2是有限的,无论总体服从什么分布,从中抽取容量为n的样本时,只要n足够大,其样本平均数的分布就趋于数学期望为a,方差为σ2 / n正态分布
  (二)德莫佛——拉普拉斯中心极限定理
  设μn是n次独立试验中事件A发生的次数,事件A在每次试验中发生的概率为P,则当n无限大时,频率设μn / n趋于服从参数tp://wiki.mbalib.com/w/images/math/7/d/f/7df5c6a71deac9b59b8c70a0f968aca4.png" alt="p,\frac{p(1-p)}{n}">的正态分布。即:
  tp://wiki.mbalib.com/w/images/math/e/b/c/ebcc767e205a5a10ad80f993e99b210d.png" alt="\frac{\mu_n}{n}~N(p,\frac{p(1-p)}{n})">
  该定理是辛钦中心极限定理的特例。在抽样调查中,不论总体服从什么分布,只要n充分大,那么频率就近似服从正态分布
  (三)李亚普洛夫中心极限定理
  设tp://wiki.mbalib.com/w/images/math/d/4/2/d4292b9b06cd038dd8b2e696675bff5f.png" alt="x_1,x_2,\cdots,x_n,\cdots">是一个相互独立的随机变量序列,它们具有有限的数学期望和方差:tp://wiki.mbalib.com/w/images/math/a/d/1/ad18e14aa03558447d2a2a6b4d4c85f9.png" alt="\alpha_k=E(X_k),b_k^2=D(X_k)(k=1,2,\Lambda,n\Lambda)"> 。
  记tp://wiki.mbalib.com/w/images/math/e/d/9/ed9b954543f0347a5fb482b20ffa31c0.png" alt="B_n^2=\sum_{k=1}^n b_k^2">,如果能选择这一个正数δ>0,使当n→∞时,tp://wiki.mbalib.com/w/images/math/3/6/0/36004382464dabc2e0087da8cdc9e11d.png" alt="\frac{1}{B_n2+\delta}\sum_{k=1}^nE|x_k-a_k|^{2+\delta}">,则对任意的x有:
  tp://wiki.mbalib.com/w/images/math/e/b/e/ebe335dec413ef384f21d22ba107e02e.png" alt="P\begin{Bmatrix}\frac{1}{B_n}\sum_{k=1}^n(x_k-a_k)<x\end{Bmatrix}\to\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt">
  该定理的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大,则这个量服从或近似服从正态分布
  (四)林德贝尔格定理
  设tp://wiki.mbalib.com/w/images/math/d/4/2/d4292b9b06cd038dd8b2e696675bff5f.png" alt="x_1,x_2,\cdots,x_n,\cdots">是一个相对独立的随机变量序列,它们具有有限的数学期望和方差 满足林德贝尔格条件,则当n→∞时,对任意的x,有tp://wiki.mbalib.com/w/images/math/e/b/e/ebe335dec413ef384f21d22ba107e02e.png" alt="P\begin{Bmatrix}\frac{1}{B_n}\sum_{k=1}^n(x_k-a_k)<x\end{Bmatrix}\to\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt">。
中心极限定理案例分析 ">编辑] 案例一:中心极限定理在商业管理中的应用
  水房拥挤问题:假设西安邮电学院新校区有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。假设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务处遇到的问题是:
  (1)未新装水龙头前,拥挤的概率是多少?
  (2)至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?
  解:(1)设同一时刻,5000个学生中占用水龙头的人数为X,则
  X~B(5000,0.01)
  拥挤的概率
  tp://wiki.mbalib.com/w/images/math/f/5/9/f59134d4a18ba08ecc41f938b20c131c.png" alt="P(\zeta>45)=1-P(0\le\zeta\le45)=1-\sum_{k=0}^{45}C_{5000}^k\times0.01^k\times0.99^{5000-k}">
  有定理2,n=5000,p=0.01,q=0.985,tp://wiki.mbalib.com/w/images/math/f/f/a/ffae46d6b34b68669040a22327320d99.png" alt="np-50,\sqrt{npq}">
  故
  tp://wiki.mbalib.com/w/images/math/3/3/b/33b484e31b13690f961fecccc03100ae.png" alt="P(0\le\zeta\le45)=\Phi(\frac{45-50}{7.04})-\Phi(\frac{0-50}{7.04})=\Phi(-7.1)-Phi(-7.1)=0.2389">
  即拥挤的概率
  P(ζ > 45) = 1 − 0.2389 = 0.7611
  (2)欲求m,使得tp://wiki.mbalib.com/w/images/math/b/a/c/bac6bc9b1cb14ded1fdd1ae3d1753a31.png" alt="P(0\le\zeta\le45)\ge0.95">
  即tp://wiki.mbalib.com/w/images/math/1/7/7/177bcb303add064a28eb2645a1b977de.png" alt="\Phi(\frac{m-50}{7.04})-\Phi(\frac{0-50}{7.04})\ge0.95">
  由于tp://wiki.mbalib.com/w/images/math/9/a/d/9ad1915ac52d984ec1ce76052e8ea368.png" alt="\Phi(\frac{m-50}{7.04})=\Phi(-7.09)\approx0">
  即tp://wiki.mbalib.com/w/images/math/c/1/1/c11ca8dd435c417053d5c59f9db511ae.png" alt="\Phi(\frac{m-50}{7.04})\ge0.95">
  查表tp://wiki.mbalib.com/w/images/math/a/e/9/ae9a011219a60a46c23ac863c1af727c.png" alt="\frac{m-50}{7.04}\ge1.645">
  即tp://wiki.mbalib.com/w/images/math/a/9/5/a95a2a7140e766d6df831e7e5c2ce813.png" alt="m\ge61.6">
  需装62个水龙头。
  问题的变形:
  (3)至少安装多少个水龙头,才能以99%以上的概率保证不拥挤?
  解:欲求m,使得
  tp://wiki.mbalib.com/w/images/math/0/4/c/04c1a643d3b0803ac4f130a340ac0ed4.png" alt="P(0\le\zeta\le45)\ge0.99">
  即tp://wiki.mbalib.com/w/images/math/9/e/c/9ec0fc6b5597739914abcfc78b49fb77.png" alt="\Phi(\frac{m-50}{7.04})-\Phi(\frac{0-50}{7.04})\ge0.99">
  由tp://wiki.mbalib.com/w/images/math/7/2/f/72ffbbd1bf2014ddabc690748cd0131b.png" alt="\Phi(\frac{0-50}{7.04})=\Phi(-7.09)\approx0">
  即tp://wiki.mbalib.com/w/images/math/1/e/a/1eafcae3a48af8ad521e3036da69e67d.png" alt="\Phi(\frac{m-50}{7.04})\ge0.99">
  查表tp://wiki.mbalib.com/w/images/math/9/d/b/9dba4f2f6e2ede8a14169b2d598ecf64.png" alt="\frac{m-50}{7.04}\ge2.325">
  即m≥66.4
  故需要装67个水龙头。
  (4)若条件中已有水龙头数量改为55个,其余的条件不变,1,2两问题结果如何?
  解:(1)
  tp://wiki.mbalib.com/w/images/math/e/3/0/e30db236a2ffdcc7d323e18a3a7490f2.png" alt="P(\zeta\ge55)=1-\Phi(\frac{55-50}{7.04})=1-\Phi(0.71)=0.2389">
  (2)同上。
  (5)若条件中的每个学生占用由1%提高到1.5%,其余的条件不变,则(1),
  (2)两问题结果如何?
  解:(1)设同一时刻,5000个学生中占用水龙头的人数为X,则
  X-B(5000,0.015)
  已知n=5000,p=0.015,q=0.985,np=75,tp://wiki.mbalib.com/w/images/math/d/3/4/d34bcc34cb9b6a748858fd539f039edf.png" alt="\sqrt{npq}=8.60">
  拥挤的概率
  tp://wiki.mbalib.com/w/images/math/5/c/a/5cab203f2340348322264631dbf1bd94.png" alt="P(\zeta>45)=1-\Phi(\frac{45-75}{8.60})=1-\Phi(-3.49)\approx1">
  (2)欲求m,使得
  tp://wiki.mbalib.com/w/images/math/b/a/c/bac6bc9b1cb14ded1fdd1ae3d1753a31.png" alt="P(0\le\zeta\le45)\ge0.95">
  即tp://wiki.mbalib.com/w/images/math/4/6/f/46f5bf784e86212db0906ae16b1bf826.png" alt="\Phi(\frac{m-75}{8.60})-\Phi(\frac{0-75}{8.60})\ge0.95">
  由tp://wiki.mbalib.com/w/images/math/2/6/9/2694096503d4801a7b051eaf1e606117.png" alt="\Phi(\frac{m-75}{8.60})\approx0">
  即tp://wiki.mbalib.com/w/images/math/b/0/0/b00ed5d60a25581b24a1cda146e39452.png" alt="\Phi(\frac{m-75}{8.60})\ge0.95">
  查表tp://wiki.mbalib.com/w/images/math/4/3/e/43e058d84d391839d50cc32b3491c64a.png" alt="\frac{m-75}{8.60}\ge1.645">
  即m≥89.14
  故需装90个水龙头。
  中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本的均值总是近似地服从正态分布。如果一个随机变量能够分解为独立同分布的随机变量序列之和,则可以直接利用中心极限定理进行解决。总之,恰当地使用中心极限定理解决实际问题有着极其重要意义。
参考文献
  1. ↑ 孔祥凤.中心极限定理在管理中的应用.现代商业,2009,(4).