[科普中国]-概率论- · 科普中国网

发展过程起源

概率论是一门研究事情发生的可能性的学问，但是最初概率论的起源与赌博问题有关。16世纪，意大利的学者吉罗拉莫·卡尔达诺（Girolamo Cardano）开始研究掷骰子等赌博中的一些简单问题。

概率与统计的一些概念和简单的方法，早期主要用于赌博和人口统计模型。随着人类的社会实践，人们需要了解各种不确定现象中隐含的必然规律性，并用数学方法研究各种结果出现的可能性大小，从而产生了概率论，并使之逐步发展成一门严谨的学科。概率与统计的方法日益渗透到各个领域，并广泛应用于自然科学、经济学、医学、金融保险甚至人文科学中。1

发展随着18、19世纪科学的发展，人们注意到在某些生物、物理和社会现象与机会游戏之间有某种相似性，从而由机会游戏起源的概率论被应用到这些领域中；同时这也大大推动了概率论本身的发展。使概率论成为数学的一个分支的奠基人是瑞士数学家伯努利，他建立了概率论中第一个极限定理，即伯努利大数定律，阐明了事件的频率稳定于它的概率。随后棣莫弗和拉普拉斯又导出了第二个基本极限定理（中心极限定理）的原始形式。拉普拉斯在系统总结前人工作的基础上写出了《分析的概率理论》，明确给出了概率的古典定义，并在概率论中引入了更有力的分析工具，将概率论推向一个新的发展阶段。19世纪末，俄国数学家切比雪夫、马尔可夫、李亚普诺夫等人用分析方法建立了大数定律及中心极限定理的一般形式，科学地解释了为什么实际中遇到的许多随机变量近似服从正态分布。20世纪初受物理学的刺激，人们开始研究随机过程。这方面柯尔莫哥洛夫、维纳、马尔可夫、辛钦、莱维及费勒等人作了杰出的贡献。1

定义传统概率传统概率又叫拉普拉斯概率，因为其定义是由法国数学家拉普拉斯提出的。如果一个随机试验所包含的单位事件是有限的，且每个单位事件发生的可能性均相等，则这个随机试验叫做拉普拉斯试验。在拉普拉斯试验中，事件A在事件空间S中的概率P(A)为：

例如，在一次同时掷一个硬币和一个骰子的随机试验中，假设事件A为获得国徽面且点数大于4，那么事件A的概率应该有如下计算方法：S={(国徽，1点)，(数字，1点)，(国徽，2点)，(数字，2点)，(国徽，3点)，(数字，3点)，(国徽，4点)，(数字，4点)，(国徽，5点)，(数字，5点)，(国徽，6点)，(数字，6点)}，A={(国徽，5点)，(国徽，6点)}，按照拉普拉斯定义，A的概率为2/12=1/6，注意到在拉普拉斯试验中存在着若干的疑问，在现实中是否存在着这样一个试验，其单位事件的概率具有精确的相同的概率值，因为人们不知道，硬币以及骰子是否"完美"，即骰子制造的是否均匀，其重心是否位于正中心，以及轮盘是否倾向于某一个数字等等。尽管如此，传统概率在实践中被广泛应用于确定事件的概率值，其理论根据是：如果没有足够的论据来证明一个事件的概率大于另一个事件的概率，那么可以认为这两个事件的概率值相等。如果仔细观察这个定义会发现拉普拉斯用概率解释了概率，定义中用了"相同的可能性"（原文是égalementpossible）一词，其实指的就是"相同的概率"。这个定义也并没有说出，到底什么是概率，以及如何用数字来确定概率。在现实生活中也有一系列问题，无论如何不能用传统概率定义来解释，比如，人寿保险公司无法确定一个50岁的人在下一年将死去的概率等。1

公理化定义如何定义概率，如何把概率论建立在严格的逻辑基础上，是概率理论发展的困难所在，对这一问题的探索一直持续了3个世纪。20世纪初完成的勒贝格测度与积分理论及随后发展的抽象测度和积分理论，为概率公理体系的建立奠定了基础。在这种背景下，苏联数学家柯尔莫哥洛夫1933年在他的《概率论基础》一书中第一次给出了概率的测度论的定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础，使概率论成为严谨的数学分支，对概率论的迅速发展起了积极的作用。

以下是公理化定义：

设随机实验E的样本空间为Ω。若按照某种方法，对E的每一事件A赋于一个实数P(A)，且满足以下公理：

（1）**非负性：**P(A)≥0；

（2）**规范性：**P(Ω)=1；

（3）可列（完全）可加性**：**对于两两互不相容的可列无穷多个事件A1，A2，……，An，……，有，则称实数P(A)为事件A的概率。1

统计定义设随机事件A在n次重复试验中发生的次数为nA，若当试验次数n很大时，频率nA/n稳定地在某一数值p的附近摆动，且随着试验次数n的增加，其摆动的幅度越来越小，则称数p为随机事件A的概率，记为P(A)=p。1

事件事件包括单位事件、事件空间、随机事件等。

在一次随机试验中可能发生的唯一的，且相互之间独立的结果被称为单位事件，用e表示。在随机试验中可能发生的所有单位事件的集合称为事件空间，用S来表示。例如在一次掷骰子的随机试验中，如果用获得的点数来表示单位事件，那么一共可能出现6个单位事件，则事件空间可以表示为S={1，2，3，4，5，6}。上面的事件空间是由可数有限单位事件组成，事实上还存在着由可数无限以及不可数单位事件组成的事件空间，比如在一次直到获得国徽面朝上的随机掷硬币试验中，其事件空间由可数无限单位事件组成，表示为：S={国，数国，数数国，数数数国，数数数数国，···}，注意到在这个例子中"数数数国"是单位事件。将两根筷子随意扔向桌面，其静止后所形成的交角假设为α，这个随机试验的事件空间的组成可以表示为。

随机事件是事件空间S的子集，它由事件空间S中的单位元素构成，用大写字母A，B，C...表示。例如在掷两个骰子的随机试验中，设随机事件A="获得的点数和大于10"，则A可以由下面3个单位事件组成：A={(5，6)，(6，5)，(6，6)}。如果在随机试验中事件空间中的所有可能的单位事件都发生，这个事件被称为必然事件，表示为；相应的如果事件空间里不包含任何一个单位事件，则称之为不可能事件，表示为。

事件的计算

因为事件在一定程度上是以集合的含义定义的，因此可以把集合计算方法直接应用于事件的计算，也就是说，在计算过程中，可以把事件当作集合来对待。

|| ||

在轮盘游戏中假设A代表事件“球落在红色区域”，B代表事件"球落在黑色区域"，C代表事件"球落在绿色区域"，因为事件A和B没有共同的单位事件，因此可表示为概率P(AB)=0。

注意到事件A和B并不是互补的关系，因为在整个事件空间S中还有一个单位事件C，其即不是红色也不是黑色，而是绿色，因此A，B的补集应该分别表示如下：以及。

条件概率

一事件A在一事件B确定发生后会发生的概率称为B给之A的条件概率；其数值为（当时）。若B给之A的条件概率和A的概率相同时，则称A和B为独立事件。且A和B的此一关系为对称的，这可以由一同价叙述：“当A和B为独立事件时，P(A∩B)=P(A)P(B)”看出。1

相关事例人们普遍认为，对将要发生的机率的一种不好的感觉，或者说不安全感（俗称“点背”）是实际存在的。下面列出的几个例子可以形象阐述人们有时对机率存在的错误的认识：

（1）六合彩：在六合彩（49选6）中，一共有13983816种可能性，普遍认为，如果每周都买一个不相同的号，最晚可以在13983816/52（周）=268919年后获得头等奖。事实上这种理解是错误的，因为每次中奖的机率是相等的，中奖的可能性并不会因为时间的推移而变大。

（2）生日悖论：在一个足球场上有23个人（2×11个运动员和1个裁判员），不可思议的是，在这23人当中至少有两个人的生日是在同一天的机率要大于50%。

（3）轮盘游戏：在游戏中玩家普遍认为，在连续出现多次红色后，出现黑色的机率会越来越大。这种判断也是错误的，即出现黑色的机率每次是相等的，因为球本身并没有“记忆”，它不会意识到以前都发生了什么，其机率始终是18/37。

（4）三门问题：在电视台举办的猜隐藏在门后面的汽车的游戏节目中，在参赛者的对面有三扇关闭的门，其中只有一扇门的后面有一辆汽车，其它两扇门后是山羊。游戏规则是，参赛者先选择一扇他认为其后面有汽车的门，但是这扇门仍保持关闭状态，紧接着主持人打开没有被参赛者选择的另外两扇门中后面有山羊的一扇门，这时主持人问参赛者，要不要改变主意，选择另一扇门，以使得赢得汽车的机率更大一些？

正确结果是，如果参赛者改变初衷，他的中奖概率将变成2/3。因为打开山羊门的那一刹那，本来的选择结果已经从1/3几率变到了1/2几率，如果改变初衷此时将是1/2中奖的几率。

有三种可能的情况，全部都有相等的可能性(1/3)︰参赛者挑山羊一号，主持人挑山羊二号。转换将赢得汽车。参赛者挑山羊二号，主持人挑山羊一号。转换将赢得汽车。参赛者挑汽车，主持人挑两头山羊的任何一头。转换将失败。在头两种情况，参赛者可以通过转换选择而赢得汽车。第三种情况是唯一一种参赛者通过保持原来选择而赢的情况。因为三种情况中有两种是通过转换选择而赢的，所以通过转换选择而赢的概率是2/3。1

计算需要提及的是下面将要介绍的9个计算概率的定理与上面已经提及的事件的计算没有关系，所有关于概率的定理均由概率的3个公理得来，同时适用于包括拉普拉斯概率和统计概率在内的所有概率理论。

定理1又称互补法则。

与A互补事件的概率始终是1-P(A)。

第一次旋转红色不出现的概率是19/37，按照乘法法则，第二次也不出现红色的概率是，因此在这里互补概率就是指在两次连续旋转中至少有一次是红色的概率，为

定理2不可能事件的概率为零。

证明： Q和S是互补事件，按照公理2有P(S)=1，再根据上面的定理1得到P(Q)=0

定理3如果A1...An事件不能同时发生（为互斥事件），而且若干事件A1，A2，...An∈S每两两之间是空集关系，那么这些所有事件集合的概率等于单个事件的概率的和。

例如，在一次掷骰子中，得到5点或者6点的概率是：

定理4如果事件A，B是差集关系，则有

定理5任意事件加法法则：

对于事件空间S中的任意两个事件A和B，有如下定理：概率

定理6乘法法则：

事件A，B同时发生的概率是：，前提为事件A,B有一定关联。

定理7无关事件乘法法则：

两个不相关联的事件A，B同时发生的概率是：注意到这个定理实际上是定理6(乘法法则)的特殊情况，如果事件A，B没有联系，则有P(A|B)=P(A)，以及P(B|A)=P(B)。观察一下轮盘游戏中两次连续的旋转过程，P(A)代表第一次出现红色的概率，P(B)代表第二次出现红色的概率，可以看出，A与B没有关联，利用上面提到的公式，连续两次出现红色的概率为：

忽视这一定理是造成许多玩家失败的根源，普遍认为，经过连续出现若干次红色后，黑色出现的概率会越来越大，事实上两种颜色每次出现的概率是相等的，之前出现的红色与之后出现的黑色之间没有任何联系，因为球本身并没有"记忆"，它并不"知道"以前都发生了什么。

所以，连续10次至少有1次出现红色的概率为。1

统计概率统计概率是建立在频率理论基础上的，分别由英国逻辑学家约翰(John Venn,1834-1923)和奥地利数学家理查德(Richard VonMises,1883-1953)提出，他们认为，获得一个事件的概率值的唯一方法是通过对该事件进行100次，1000次或者甚至10000次的前后相互独立的n次随机试验，针对每次试验均记录下绝对频率值和相对频率值hn(A)，随着试验次数n的增加，会出现如下事实，即相对频率值会趋于稳定，它在一个特定的值上下浮动，也即是说存在着一个极限值P(A)，相对频率值趋向于这个极限值。

这个极限值被称为统计概率，表示为：。

例如，若想知道在一次掷骰子的随机试验中获得6点的概率值可以对其进行3000次前后独立的扔掷试验，在每一次试验后记录下出现6点的次数，然后通过计算相对频率值可以得到趋向于某一个数的统计概率值。

|| ||

上面提到的这个有关相对频率的经验值又被称为大数定律，是频率理论学家定义概率论的基础。然而没有人可以将骰子无限的扔下去，因此在实践中也就无法有力的证明大数定律，许多来自数学理论的论证至今也没有取得成功。尽管如此，统计概率在今天的实践中具有重要意义，它是数理统计的基础。1

完全概率n个事件H1，H2，...Hn互相间独立，且共同组成整个事件空间S，即，而且。这时A的概率可以表示为

例如，一个随机试验工具由一个骰子和一个柜子中的三个抽屉组成，抽屉1里有14个白球和6个黑球，抽屉2里有2个白球和8个黑球，抽屉3里有3个白球和7个黑球，试验规则是首先掷骰子，如果获得小于4点，则抽屉1被选择，如果获得4点或者5点，则抽屉2被选择，其他情况选择抽屉3。然后在选择的抽屉里随机抽出一个球，最后抽出的这个球是白球的概率是：

P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)

=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)

=28/60=0.4667

从例子中可看出，完全概率特别适合于分析具有多层结构的随机试验的情况。1

贝叶斯定理贝叶斯定理由英国数学家贝叶斯(Thomas Bayes,1702-1761)发展，用来描述两个条件概率之间的关系，比如P(A|B)和P(B|A)。按照定理6的乘法法则，，可以立刻导出贝叶斯定理：如上公式也可变形为例如：。2

一座别墅在过去的20年里一共发生过2次被盗，别墅的主人有一条狗，狗平均每周晚上叫3次，在盗贼入侵时狗叫的概率被估计为0.9，问题是：在狗叫的时候发生入侵的概率是多少？

人们假设A事件为狗在晚上叫，B为盗贼入侵，则，，，按照公式很容易得出结果：。

另一个例子，现分别有A，B两个容器，在容器A分别有7个红球和3个白球，在容器B里有1个红球和9个白球，现已知从这两个容器里任意抽出了一个球，且是红球，问这个红球是来自容器A的概率是多少?

假设已经抽出红球为事件B，从容器A里抽出球为事件A，则有：，，，按照公式，则有：。

虽然概率论最早产生于17世纪，然而其公理体系却在20世纪的20至30年代才建立起来并得到迅速发展，在过去的半个世纪里概率论在越来越多的新兴领域显示了它的应用性和实用性，例如：物理、化学、生物、医学、心理学、社会学、政治学、教育学，经济学以及几乎所有的工程学等领域。

特别值得一提的是，概率论是今天数理统计的基础，其结果常被用做问卷调查的分析资料，而且也用于对经济前景进行预测。1