弱大数定理

目录

1 引子

在概率论中,极限定理是最重要的理论结果。在极限定理中最核心的结果是大数定理和中心极限定理。通常,大数定理是考虑随机变量序列的平均值收敛到某预期值。相比之下,中心极限定理证明大量随机变量之和的分布在某种条件下逼近于正态分布。

2 马尔科夫不等式和切比雪夫不等式

首先引入马尔科夫不等式:

X为取非负值的随机变量,则对于任何常数a>0,有:

P{Xa}E[X]a

对于a>0,令:

I={1Xa0others

由于X0,我们有:

IXa

对上述不等式两边求期望,得:

E[I]1aE[X]

因为E[I]=P{Xa},所以命题得证。

X是随机变量,均值μ和方差σ2都是有限值,则对任何k>0,有:

P{|Xμ|k}σ2k2

由于(Xμ)2为非负随机变量,利用马尔科夫不等式a=k2,得:

P{(Xμ)2k2}E[(Xμ)2]k2

由于(Xμ)2k2|Xμ|k是等价的,因此上式等价于:

P{|Xμ|k}E[(Xμ)2]k2=σ2k2

马尔科夫不等式和切比雪夫不等式的重要性在于,我们能够在只知道分布的期望或者只知道分布的期望和方差时,利用它们导出概率上界。当然,如果实际概率分布已知,我们可以直接计算准确的概率而不必推导概率上界。

3 例子

假设已知某工厂在一周内生产的产品数量是一个均值为50的随机变量。

  1. 本周内产品数量超过75件的概率是多少?
  2. 如果我们进一步知道每周产量的方差为25,那么本周产量在40到60之间的概率是多少?

X为该工厂本周所生产的产品数量。

  1. 由马尔科夫不等式,得:P{X>75}E[X]75=5075=23
  2. 由切比雪夫不等式,得:P{|X50|10}σ2102=14
    所以P{|X50|<10}114=34

设随机变量X服从(0,10)上的均匀分布,那么,因为E[X]=5,Var[X]=25/3,所以利用切比雪夫不等式可得:

P{|X5|>4}253×160.52

而实际的概率值为:

P{|X5|>4}=0.20

从上面的例子可以看出,我们利用切比雪夫得到概率上界,但不能用它来估计概率值本身。因此,尽管切比雪夫不等式是正确的,但是它所导出的上界并不那么贴近实际概率值。切比雪夫的一个重要的应用体现在一些命题的证明过程中。

Var[X]=0,则:

P{X=E[X]}=1

换言之,一个随机变量的方差为零的充要条件是这个随机变量以概率1等于常数。

利用切比雪夫不等式,对任何n1

P{|Xμ|>1n}=0

n,并应用概率的连续性性质,得:

0=limnP{|Xμ|>1n}=P{limn{|Xμ|>1n}}=P{Xμ}

得证。

4 弱大数定理

X1,X2,为独立同分布的随机变量序列,其公共期望E[Xi]=μ有限,则对任何ϵ>0:

P{|X1++Xnnμ|ϵ}0n

我们只在Var[Xi]=σ2有限的情形下证明此定理。此时,因为:

E[X1++Xnn]=μ,Var[X1++Xnn]=σ2n

利用切比雪夫不等式,得:

P{|X1++Xnnμ|ϵ}σ2nϵ2

得证。

弱大数定理最早是詹姆斯伯努利在Xi只取0或者1的特殊情况下证明的。