比率P的假设检验及其应用-2016.06.08一读

更新时间:2023-11-05 15:15:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

比率P的假设检验及其应用

摘要:假设检验是统计推断的另一项重要内容,它与参数估计类似,但角度不同。

参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。本文将主要介绍总体比率的假设检验的原理和方法,以及其在各种生活实例中的应用,从而更深的了解假设检验在各种统计方法中的重要作用。

关键词:假设检验;总体比率;检验统计量;拒绝域

Hypothesis Testing and Its Application of Ratio P

Abstract:Hypothesis testing is another important content to statistical inference, and it is

similar to parameter estimation, but the Angle is different. Parameter estimation is use sample information to infer an unknown population parameter, and the hypothesis testing is a hypothesis is proposed first in the overall parameters, and then using the sample information to determine whether the hypothesis is established. This article mainly introduces the overall rate of the principle and method of hypothesis testing, and its application in all kinds of living examples, thus deeper understanding of the hypothesis testing plays an important part in all kinds of statistical methods.

Key words:hypothesis testing;the overall rate;test statistics;rejection region

目录

一、假设检验的基本问题 (一)假设检验的概述 (二)假设检验的基本步骤 (三)检验的P值

二、总体比率的假设检验及其应用 (一)单个总体比率的假设检验

1.单个总体比率的精确检验及其应用 2.单个总体比率的大样本检验及其应用 (二)两个总体比率的假设检验

1.两个总体比率之差的精确检验及其应用 2.两个总体比率之差的大样本检验及其应用

一、假设检验的基本问题 (一)假设检验的概述

假设检验是统计推断的一项重要组成部分,它在各种统计方法中都有极其重要的应用。假设检验通过首先对总体参数提出的一个假设,然后利用样本信息推断这个假设是否成立这样一个过程,来判断承认还是拒绝该假设。

(二)假设检验的基本步骤

1.建立假设

在假设检验中,通常把被检验的假设叫做原假设,用H0表示,当原假设被拒绝时接受的假设叫做备择假设,用H1表示。在任一假设检验中,原假设与备择假设都是相互对立的,且二者只能居其一。

2.选择检验统计量 建立假设后,对于是否接受原假设则需要根据某一统计量出现的数值,从概率意义上判断来完成,这个统计量称为检验统计量。 3.显著性水平

检验的结果不一定是真实的情况,所以说,检验是有可能犯错误的。在假设检验中可能会犯的错误有两类:一是原假设为真却拒绝原假设,称这种错误为第一类错误,其发生的概率叫做犯第一类错误的概率,或称为拒真概率,在假设检验中把犯第一类错误的概率称为显著性水平,通常用α表示,即

α=P(拒绝H0 | H0为真)=Pθ(X∈W)?

另一种错误是原假设为假却接受原假设,称这种错误为第二类错误,其发生的概率叫做犯第二类错误的概率,或称为受伪概率,通常用β表示,即

β=P(接受H0 | H1为真)=Pθ(X∈W)

这两类错误之间也存在着这样的关系:当α减小时,β会随之增大;当β减小时,?α会随之增大。这个现象不是偶然的,而具有一般性,也就是说,在样本容量不变的前提下,找到一个使α和β都减小的检验是不可能的,唯一能使α和β同时减小的方法是增大样本容量。

在假设检验中,发生哪一类错误的后果更为严重,就应首先减小哪类错误发生的概率,通常情况下允许犯第一类错误的概率,尽量减小犯第二类错误的概率,一般取α=0.05和0.01,表示发生的概率很小。 4.给出拒绝域

拒绝域是指使原假设被拒绝的样本观测值所在的区域,用W表示。若统计量的值落在拒绝域内,则拒绝原假设;反之,则接受原假设。 5.由样本值计算结果

(三)检验的P值

假设检验的判断还有另外一种形式,即计算检验的P值,检验的P值就是在一个假

设检验中,可以利用样本观测值做出拒绝原假设的最小显著性水平。将检验的P值与心目中的显

著性水平α进行比较,就可以很容易的做出检验的结论。判断如下: 如果α≥p,则在显著性水平α下拒绝原假设; 如果α<p,则在显著性水平α下接受原假设。

二、总体比率的假设检验及其应用 (一)单个总体比率的假设检验 1.单个总体比率的精确检验及其应用

下文所提到的比例p可将其看作某事件发生的概率,即为两点分布(按:即0-1分布)X~B(1,p)中的参数。做n次独立试验,用x标记事件发生的次数,则X~B(n,p),(按:即二项分布)。。 (1)设x1,x2,?xn为两点分布X~B(1,p)的样本,考虑右侧假设检验:

H0:p?p0vsp?p0,给出拒绝域W??x?c?,由于x为整数,所以c取非负整数值。但

是对于给定?的,不一定找到恰好的c,使

(1)设x1,x2,?xn为两点分布X~B(1,p)的样本,考虑右侧假设检验:H0:p≤p0,H1:p>p0,给出拒绝域W??x?c?,由于x为整数,所以c取非负整数值。但是对于给定?的,不一定找到恰好的c,使

n?n?i?n?in?in?i????i?p0(1?p0)??????i??p0(1?p0), i?c0??i?c0?1??n对此情况比较常见的办法是,找一个c0,使

?n?in?i?P(x?c;p0)???p(1?p)??00?i?i?c??

若取c=c0,相当于提高检验的显著性水平,若取c=c0+1,则相当于降低检验的显

n著性

?n?in?iP(x?c;p0)????i??p0(1?p0)??i?c??水平,由于取c=c0+1可以保证的左侧不大

n于?(按:对c0+1,上面的小概率P比c0会更小≤?,设小c自然检验更加明显,检

验效率更高,但容易弃真),所以取c=c0+1可得到水平为α的检验。

由此可以类似推出,对于假设检验问题H0:p≥p0,H1:p<p0,检验的拒绝域可以为

?n?in?i?W??x?c?,c为满足??p(1?p)??的最大正整数。 00?i?i?c0??n对于假设检验问题H0:p=p0,H1:p≠p0,检验的拒绝域为W??x?c1或x?c2?,其中

n?n?i?n?i??n?in?ic1为满足??c?的最大整数,为满足的最小??p(1?p)?p(1?p)?2?000?i?0??22i?0??i?c2?i?c1整数。

(2)应用

例1.1.1 在一次模拟考试后,某班级的班主任对这次的成绩做了一次统计,统计结果发现有40%的同学达到了80分以上,现从该班级随机抽取20名同学,其中有5位同学成绩在80分以上。在显著性水平??0.05下,能否认为这次的统计结果属实? 解:由题意可知:这是一个关于单个总体比率的双侧假设检验问题,由于n?18?30,故可用精确检验的方法进行检验。设该班级学生成绩达到80分以上的比率为p,x表示20名学生中成绩达到80分以上的人数,则x~b(20,p)。 现建立假设:H0:p?0.4;H1:p?0.4

拒绝域为:W??x?c1或x?c2?,下求c1和c2 由前面可知:

n?n?i?n?i??n?in?i?c1为满足??c的最大整数,为满足的最小??p(1?p)?p(1?p)?2?00?i?0?i?022i?0??i?c2??c1整数,又因

P(x?3)?0.0160?0.025?P(x?4)?0.0510

故c1?3,又有

P(x?11)?0.0564?0.025?P(x?12)?0.022

故c2?12,所以拒绝域为W??x?3或x?12?,由于观测值5不在拒绝域内,也就是说未落入拒绝域,即接受原假设,可以认为这次的统计结果属实。

例1.1.2 某工厂在一次对产品质量的调查中显示,该产生产的产品优质品率不低于30%,为了验证这一结论,该产随机从生产的产品中抽取了15件产品,其中发现有3件是优质品。问:在显著性水平??0.05下,能否认为这次的调查结果属实?并给出检验的P值。

解:由题意可知:这是一个关于总体比例的左侧的假设检验。设p表示该工厂产品的优质品率,x表示抽取的15件产品中的优质品数,则可有x~b(15,p)。 先建立假设:H0:p?0.3;H1:p?0.3

检验的拒绝域为:W??x?c?,下计算c的值。

由于P(x?1)?0.0352?0.025?P(x?2)?0.1269,所以可取c?1,检验的拒绝域为

W??x?1?,因题中得到的优质品数为3,未落入拒绝域,故接受原假设,可以认为这次的调查结果属实。

本题也可通过计算检验的P值得出结论,用X表示服从二项分布b(15,0.3)的随机变量,则检验的P值为:

?15?x15?x?p?P(x?3)???0.3(1?0.3)?0.2969 ?x?x?0??3由于检验的P值0.2969?显著性水平??0.05,故接受原假设,所以可以认为这次的调查结果属实。

2.单个总体比率的大样本检验及其应用

~(1)设样本x1,x2,?xn取自两点分布总体X~B(1,p),其中p表示样本比例,p为对p近似服从均总体比率的某一假设值。当n很大,np和n(1?p)都大于5时,样本比例~n?~p?p0?值为p,方差为p(1?p)/n的正态分布,而标准化检验统计量u?,则近似p0(1?p0)服从标准正态分布。

在给定显著性水平的条件下,表1总结了大样本情况下总体比例检验的一般方法。 表1.大样本情况下单个总体比率的检验方法 双侧检验 左侧检验 右侧检验 假设形式 检验统计量 拒绝域 H0:p?p0;H1:p?p0 H0:p?p0;H1:p?p0 H0:p?p0;H1:p?p0 n(~p?p0) u?p0(1?p0)u?u1??2 u?u? u?u1?? (2)应用 例1.2.1政府在对消费者的一项调查中表明,18%的居民的早餐饮料是牛奶。某一城市的牛奶商却认为,该城市的居民早餐饮用牛奶的比例应该更高。为了证明这一说法,该生产商随机抽取了一个500人的随机样本,其中有120人早餐饮用牛奶。在

本文来源:https://www.bwwdw.com/article/5b82.html

Top