距离上次更新已经过了一个月了,这一个月发生太多了。数学建模国赛的结果已经没有意义了,因为是铁定寄了,最后国庆在摆烂了几天以后终于想起了写一篇blog,这一篇开始整理一些概率论与数理统计的内容。
由概率的公理化的条件,可以推出许多概率的性质,这里指出两个不是很显然的性质:
性质1: $P\left( B-A \right) =P\left( B \right) -P\left( AB \right) $
证明:这个性质有一个朴实的理解:“事件$B-A$的概率等于$B$的概率减去$A$和$B$同时发生的概率”,如果我们想当然的受集合的影响,脑补出两个圆圈,把这个用集合的交并补来理解,是没有问题的,因为这一套系统本身是自洽的,但这有点逃课的意味了。
由于$B-A=\bar{A}B=(\varOmega -A)B=B-AB$(这个其实有时一眼可能会突然没反应过来,即$B-A=B-AB$,习惯就好),而$AB\subset B$,所以有$B=AB\cup \left( B-AB \right) ,AB\cap \left( B-AB \right) =\varnothing $,而根据概率的定义,$P\left( B \right) =P\left( AB \right) +P\left( B-AB \right) $,又因为$B-A=B-AB$,所以$P\left( B-A \right) =P\left( B \right) -P\left( AB \right) $。
性质2:$P\left( A\cup B \right) =P\left( A \right) +P\left( B \right) -P\left( AB \right) $
证明:这个形式的结构我们曾看见过许多次,例如维数定理:$dimW_1+dimW_2=dim\left( W_1+W_2 \right) +dim\left( W_1\cap W_2 \right) $,这里就不探讨他们的共性(实际上当你把概率的大小看作某种在样本空间中维数的度量,这就说得通了。),只探究性质2本身:
$A\cup B=A\cup \left( \bar{A}\cap B \right) =A\cup \left( B-AB \right) $,且$A\cap \bar{A}\cap B=A\left( B-AB \right) =\varnothing $。
再根据性质1,可以得到
实际上这个性质是容斥原理的体现,可以推广到多个事件的情况,当有三个事件时:
更一般的:
下面是考虑一个事件发生的条件下某事件发生的概率,这里面臭名昭著的例子就是“男孩患病,患病男孩。”和经常被拿出来水的“家里有两个孩子,其中一个是女孩,求另一个孩子是女孩的概率。”
对于第二个例子,最正统的解答是:该概率指的是存在一个孩子是女孩的条件下,求另一孩子是女孩的概率。
那么记$A$为存在一个孩子是女孩,记为两个孩子都是女孩,则:
这实际上就是条件概率的应用:在事件A发生下B的概率。
下面再举一个更好的例子为后文作铺垫,即三门问题。你面前有三个关闭的门,其中一个门后面有一个汽车,当你打开那个后面是汽车的门,汽车就归你了。但另外两个门后面是两只山羊,与此同时另外一个人是知道哪个门是车哪个门是羊的,当你选择了一扇门后,另一个人会打开另外两扇门其中之一露出里面的山羊,此时另一个人会问你要不要换一扇门来打开。
实际上,如果换门了,得到汽车的概率是$\frac{2}{3}$,如果不换是$\frac{1}{3}$。这相当的反直觉,但这是对的。
这个问题可以这么描述,选择$A,B,C$的获奖概率$P\left( A \right) =P\left( B \right) =P\left( C \right) =\frac{1}{3}$,你选择了$A$,另一个人打开了$C$,求此时的获奖概率$P\left( A|c \right) ,P\left( B|c \right) $。
则我们说此时$P\left( X|Y \right) $是指另一个人选$Y$的情况下你选$X$获奖的概率,则根据条件概率:
注意此时的$P(c)$是指另一个人选择$C$的概率,并不是上面的$P(C)=\frac{1}{3}$。
同时考虑到如下事实:
①当你选择$A$且$A$中奖时,另一个人打开$C$的概率是$\frac{1}{2}$,即$P\left( c|A \right) =\frac{1}{2}$
②当你选择$A$且$B$中奖时,另一个人打开$C$的概率是1,即$P\left( c|B \right) =1$
③当你选择$A$且$C$中奖时,另一个人将不会打开$C$,即$P(c|C)=0$
所以另一个人选择$C$的概率为:$P\left( c \right) =P\left( A \right) P\left( c|A \right) +P\left( B \right) P\left( c|B \right) +P\left( C \right) P\left( c|C \right)= \frac{1}{2}$
则带入上式可得$P\left( A|c \right)=\frac{1}{3} ,P\left( B|c \right)=\frac{2}{3}$。也就是说如果换门,得到汽车的概率会变大。
上面的回答其实蕴含了$Bayes$公式和全概率公式,补充后下文将对这个反直觉的现象作回答。
首先补充乘法公式,实际上对条件概率进行等价变形得$P\left( AB \right) =P\left( A \right) P\left( B|A \right) $。
全概率公式:设$\varOmega $是样本空间,$A$为随机事件,$B_1,B_2,..,B_n$为对样本空间$\varOmega $的一个划分,则:
贝叶斯公式:由条件概率的定义及全概率公式:
取$n=2$时,上述公式较为常用,现在来解释上面的“一个是女孩,另一个是女孩的概率。”和“三门问题”,在此之前有一个先引入一个非常感性的例子:“一位同学是个文艺青年,他对英语以及语言学很感兴趣,平时喜欢唱歌和听英语新闻,并且唱歌很好听”。之后感性的猜测一下,他是外语专业的可能性大还是计算机专业的可能性大。在这个信息下,人们可能会作出“是外语专业的可能大于是计算机专业的可能”。因为考虑了我提供的信息。但是在西安电子科技大学外语专业所占人数相当少,与计算机几乎是1:15。也就是说从16个人里挑一个,他大概率是计算机专业的,这引发了矛盾。
实际上这正是因为,信息对概率判断的更新,概率存在在被给予的条件下,概率不能寄托在实际的物体上。对于上面两孩问题,如果不给任何信息,那么两个女孩的概率正是四分之一。而如果告诉你其中有一个孩子是女孩,那么实际上信息更新了样本空间,两个男孩的情况被排除掉,则概率就变成了三分之一。对于三门问题,在另一个人打开一个门之前,换门对得奖的概率是没有影响的,在该条件下,换了门也是三分之一的盲选,而当另一个人作出判断后,新信息也更新了此时的样本空间,而产生了此时的反直觉的结论。
最后是一道练习题:
设有来自三个地区的考生的报名表分别为10份,15份和25份,其中女生的报名表分别为3份,7份,5份,随机地选取一个地区的报名表,从中先后抽取2份。
(1)求先抽到的一份是女生表的概率;
(2)已知后抽到的一份是男生表,求先抽到的一份是女生表的概率;
(3)已知先抽到的一份是女生表,后抽到的一份是男生表,求他们是第二地区的概率;
解:
设$P\left( A_i \right) $表示抽到的表是$A_i $地区的概率,$P\left( B_j \right) $表示第$j$次抽到的是男生表。
则$P(A_1)=P(A_2)=P(A_3)=1/3$,$P(B_1|A_1)=P(B_2|A_1)=7/10,P(B_1|A_2)=P(B_2|A_2)=8/15,P(B_1|A_3)=P(B_2|A_3)=20/25$,
在这里$B_1,B_2$在$A_i$下概率相同是由于抽签先后不影响结果。
(1)
(2)
(3)