本篇是关于假设检验和单侧置信区间的,是用来补充数理统计2的。马上就要考试了,如果给我一次重来的机会,我应该平时就学的。
WARNING:由于我写这篇时没时间了,所以这一篇可能写的有点抽象。
在数理统计2中作双侧置信区间时,我们是将$1-\alpha$分为$\pm \frac{\alpha}{2}$。而对于单侧置信区间,我们只关注它的上限或下限,所以单侧置信区间的求法和双侧没有区别,只是将$\alpha/2$换成$\alpha$。这里要指出在之前忽略的一部分内容,这与$N,F,t,\chi^2$分布的性质有关。
对于置信水平,实际上我们可以认为我们在找特定的上分位点。对于一个分布$\xi$,对于双侧区间:
其中$\zeta$是所选的统计量。对于$N,t$,它们是对称的,取值可以取遍全体实数,所以有:
对于卡方分布,没有这个特殊的性质,所以当选取的统计量服从卡方分布时,就直接是:
对于$F$分布,有:
熟悉这些性质有助于许多内容的理解。对于某些估计值的单侧区间,我们只要知道关注的是上限还是下限,直接将$\alpha/2$换成$\alpha$,选择需要的区间即可。这里值得注意的其实是,由分布定理导出的估计值,往往与选取的统计量在计算时会翻到不等号的另一边。这就导致了一个反转的现象。这点在假设检验中也有类似的现象,但原理并不一样。下面我们来讨论假设检验。
例如我们要讨论$H_0:\mu \ge \mu_0$,在我们知道总体方差的情况下,我们仍然借助$\frac{\bar{X}-\mu _0}{\sigma /\sqrt{n}}\sim N\left( 0,1 \right) $来进行判断,如果$\mu \ge \mu_0$确实成立,那么$\bar{X}-\mu _0$不应该太小,我们就设犯错误的概率最大为$\alpha$(显著性水平),那么我们就会以$-z_\alpha$作临界点,当$\frac{\bar{X}-\mu _0}{\sigma /\sqrt{n}}$比临界点小时,拒绝$H_0$接受$H_1$;反之接受$H_0$拒绝$H_1$。
所以假设$H_0:\mu \ge \mu_0$,我们实际上是找一个左端点来度量,左端点右边是接受域,所以叫左边检验。反之就是右边检验,得到右端点,右端点左边是接受域。
上面的内容确实很抽象,如果有看的人我建议结合着课本强化理解,如果你理解了,会发现其实假设检验的考试题根本不需要背,我的一个朋友非常喜欢有参考压缩,下面我展示一下如何在只记住三大抽样分布定理的情况下,结合题目解压出答案。
①灯泡寿命服从$\sigma^2=100^2$的正态分布,抽取某天生产的$40$只灯泡进行测试,得到样本方差$s^2=15000$,问在显著性水平$\alpha=0.05$下,能否断定灯泡寿命波动显著增大($\chi _{0.05}^{2}\left( 39 \right) =54.572$)
我们希望灯泡寿命没有明显波动,那么:
没有给总体均值$\mu_0$,只给了$s^2,\sigma^2$,我们考虑用$(n-1)S^2/\sigma^2$,如果$s^2$特别大,说明波动一定显著增大,所哟我们的接受域是$(0,k)$,这里$k=\chi _{0.05}^{2}(39)$。所以接受域是$(0,54.572)$
我们计算统计量$\chi^{2}$:$\chi ^2=\frac{\left( 40-1 \right) \times 15000}{100^2}=58.558>54.572$,所以我们拒绝$H_0$接受$H_1$。
②灯泡厂进行了工艺革新,分别抽取$10$只革新前后的灯泡做寿命试验,革新前的灯泡样本均值为$2460$小时,标准差为$56$小时;采用新工艺后的灯泡寿命的样本均值为$2550$小时,标准差为$48$小时。设灯泡寿命服从正态分布,两个样本构成的合样本相互独立,是否可以认为采用新工艺后的灯泡寿命有显著提高$(\alpha=0.01,F_{0.005}(9,9)=6.54,t_{0.01}(18)=2.55)$
这是一个双正态总体检验,我们设采用新工艺前的寿命$X \sim N(\mu_1,\sigma_1^2)$,采用新工艺后的寿命服从$Y \sim N(\mu_2,\sigma_2^2)$。
那么首先需要检验$\sigma_1^2=\sigma_2^2$,如果这个不成立,我们对平均寿命的估计就没有了意义。需检验:
只给了我们样本方差,所以我们选取$F$为统计量:
$\alpha=0.01,n_1=10,n_2=10$,所以接受域为:
统计量的样本值为$56^2/48^2=1.36$,在接受域内,所以接受$H_{01}$
之后检验方差,我们说需检验:
虽然我们是希望$\mu_2>\mu_1$的,但是为了后面列写统计量的方便,我们写上面这样的假设。由于我们只有样本均值和方差,只能用$t$分布。
这是个左边检验,如果$H_{02}$是真的,那么$T$不应太小,所以我们只需找左临界点,实际上就是$t_{0.01}(18)=2.55)$,所以接受域为$(-2.55,+\infty)$
我们计算统计量的样本值:
所以我们拒绝$H_{02}$,认为新工艺实施后灯泡平均寿命显著提高。
往后应该不会再有这种赶工的blog……很遗憾,还有很多数理统计的内容没来得及学习,毕竟是面向考试学习,有的放矢。还有几分钟了,我忽然寻思……“算法工程师”要求“数理基础”,上一下逼乎,人家一顿微分几何,什么流形学习,给你整的一愣一愣的。能学多少就学多少吧,以后抽时间把教师职业资格证考了,然后炼丹纯图一乐,又不靠这个找工作。