概率定义的演进

目录

1 古典概型

概率是描述事件出现或者发生可能性大小的数量指标,它是逐步形成和完善起来的。最初人们讨论的是古典概型试验中事件发生的概率。所谓古典概型试验是指样本空间中的样本点的个数是有限的且每个样本点发生的可能性是相同的,简称有限性与等可能性。

例如丢一枚均匀的硬币,或者丢一枚均匀的骰子(你应该明白这里"均匀"的含义) ,这些试验都是古典概型试验。对于古典概型试验,定义如下:

古典概型 设试验\(E\)是古典概型的,其样本空间 \(\Omega\)由\(n\) 个样本点组成,其一时间 \(A\) 由\(r\)个样本点组成,则定义\(A\)发生的概率为\(\frac{r}{n}\),即\[P(A) = \frac{r}{n}\]. 并称这样定义的概率为古典概率,称概率的这样定义为古典定义。

古典概率具有三个性质:

  1. 对任意事件 \(A\) 有,\(0 \leq P(A) \leq 1\)
  2. \(P(\Omega) = 1\)
  3. 设 \(A_{1},A_{2},\ldots,A_{m}\)为两两互斥的\(m\)个事件,则\[P(\bigcup_{i=1}^{m}A_{i}) = \sum_{i=1}^{m}P(A_{i})\]

这三个性质称为概率的有界性,规范性和有限可加性。

2 几何概型

古典概型的定义要求试验满足有限性与等可能性,这使得它在实际应用中受到了很大的限制。

例如,对于旋转均匀陀螺的试验:在一个均匀的陀螺圆周上刻上 \([0,3]\)之内的数字(由于是圆周0和3刻在一个位置),旋转陀螺,当陀螺停下时,其圆周上与桌面接触的刻度位于某个区间\([a,b]\subset [0,3]\)的概率有多大?对于这个试验,古典概率的定义就不适用。因为这个试验的样本点不是有限的,而是区间\([0,3]\)内的每个点,有无穷多个且不可数。为了克服古典概型的缺陷,人们引入了几何概型。

几何概型 设试验\(E\)的样本空间为某可度量的区域\(\Omega\),且\(\Omega\)中任一区域出现的可能性大小与该区域的几何度量称正比,而与该区域的位置与形状无关,则称\(E\)为几何概型的试验。且定义\(E\)的时间\(A\)的概率为:\[P(A)=\frac{GM(A)}{GM(\Omega)}\]

其中 \(GM(A)\)为\(A\)的几何度量,\(GM(\Omega)\)为\(\Omega\)的几何度量。

如果\(\Omega\)是一维,二维,三维的则,其几何度量分别是长度,面积和体积。几何概率除了具有古典概率的三个性质外,还有可列可加性:

4.设\(A_{1},A_{2},\ldots\)为两两互斥的无穷多个时间,则\[P(\bigcup_{i=1}^{\infty}A_{i}) = \sum_{i=1}^{\infty}P(A_{i})\]

3 统计概型

概率的几何定义虽然去掉了有限性的限制,但是它仍然要试验满足等可能性,这在实际问题中仍有很大的局限性。例如如果我们硬币,骰子或者陀螺不是均匀的,其结果就不是等概的了。因此,我们必须进一步的推广概率的定义,使其满足实际的需求。于是,有了概率的统计定义。

统计概率定义 设\(A\)为试验\(E\)的一个事件,如果随着重复实验次数的增加\(A\)出现的频率在0与1之间某个数\(p\)附近摆动,则定义\(A\)的概率为\(p\),即\[P(A)=p\] 称这样定义的概率为统计概率,称概率的这样定义为统计定义。

统计概率也有古典概率的三个性质,即有界性,规范性和有限可加性。概率的统计定义对试验不做任何要求,它适合所有试验,也比较直观,但是在数学上不够严密。比如我们抛硬币,抛了一万次后正面出现的事件次数为4998,反面出现的次数为5002,则首先我们无法说10000次到底是多还是少,另外4998和5002到底是在5000左右摆动造成的还是本来就如此。因此概率的统计定义也有其缺陷。

4 概率的公理性定义

为了克服以上三个定义的局限性,20世纪30年代柯尔莫哥洛夫以上述三个定义为基础给出了严密的概率公理性定义:

概率的公理性定义 设\((\Omega,\mathcal{F})\)为一个可测空间,\(P\)为定义与\(\mathcal{F}\)上的实值集合函数,如果\(P\)满足下列三个条件:

  1. 对于每个\(A\in\mathcal{F}\),有\(P(A)\geq 0\)
  2. \(P(\Omega) =1\);
  3. 如果 \(A_{i}\in \mathcal{F}_{i},i=1,2,3,\ldots\)且当\(i\neq j\)时,\(A_{i}A_{j}= \varnothing\),则 \(P(\bigcup_{i=1}^{\infty}A_{i}) = \sum_{i=1}^{\infty}P(A_{i})\)

那么,就成\(P\)为概率测度,简称为概率。

概率的公理化定义没有要求定义于\(\mathcal{F}\)上的实值集合函数\(P\)满足有界性与有限可加性。因为有界性和有限可加性可以由三个公理推导出来。

这里要插播一句:一个概念的定义要求所满足的条件越少越好,这样便于应用。另外概率的公理化定义是严密的数学定义,且对试验不做任何要求。那么我们就会有疑问,是不是抛弃前面三个定义了?不可以。因为概率的公理化定义给出了概率的严密定义,但是没有给出概率的计算方法。要计算一个具体事件的概率,还得根据不同的情况,利用上述三个定义之一来计算。