数理统计-假设检验

更新时间:2023-04-24 12:26:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第七章假设检验 7.1  7.2  7.3  7.4 假设检验的基本思想与概念 正态总体参数的假设检验 其它分布的参数假设检验 分布拟合检验

7.1假设检验的基本思想与概念 7.1.1  7.1.2  7.1.3  7.1.4  7.1.5  7.1.6  7.1.7  7.1.8 假设检验问题 假设 检验和检验统计量 两种错误概率与检验的水平 功效函数与无偏检验 假设检验的基本思想与基本步骤 概率值(p值) 零假设选择

7.1.1 假设检验问题在现实生活中的,假设(hypothesis)是指有一定理由提出,但又没有充足依据的一种陈述或条件。对一个假设,人们要依据一定的事实和思索来作出是接受它还是拒绝它的判断。这类问题从思维方式上看是从结果推断原因的问题。有时又是非常微妙、涉及到人们对决策的态度、甚至可能牵涉到人们利益的问题。统计假设:关于统计模型的假设,今后我们常将统计假设简称为假设。统计检验:依据样本来对统计假设作出接受或拒绝的判断的过程。今后我们常将统计检验简称为“检验” 。统计假设检验有一套系统的理论,深入理解贯穿这一理论的那种独特思维方式,不仅对学好这个理论是非常重要的,而且对一般思维方式的训练和提高也会有很大的帮助。下面我们先结合一个具体的例子来介绍统计假设检验的基本思路,然后再逐个介绍包含在这个思路中的一些重要的基本概念。

例 7.1.1 假定某电视机厂(甲方)要从某电子元件厂(乙方)购入一批元件,用于组装电视机。为了保证产品质量,降低成本,甲方希望这批元件的合格品率达到99%以上。乙方也保证这一点。问题是:这批元件的合格品率是否达到99%以上?如果记这批元件的次品率为p,问题就相当于对假设

H :“ 整批产品的次品率 p 不超过 1 ”% 作出接受或拒绝的判断。为此甲、乙双方需要商定一个判断的方法。通常的做法是从这批元件中抽取若干样品进行检测,检测目标是确定所测样品合格与否,然后根据样品检测结果来决定甲方是接受或拒绝这批元件(假设H)。显然,如果样品中次品越多,就对乙方越不利,反之如果样品中次品越少就对乙方越有利。但样品中次品数要多到什么程度时甲方才能拒绝这批元件?

例7.1.1(续1) 具体的作法是甲、乙双方事先先商定要检测样品的总数 n和样品中允许的不合格品数目的临界值 k . 当检测出样品中的不合格品数达到 k时,甲方就拒绝假设H,同时也就拒绝这批元件。否则甲方就接受假设H,同时也就接受这批元件。这个决定接受或拒绝一个假设的过程就称为“检验”。现在的问题是:如何确定n?在确定了n后,又如何确定 k?

这两个问题的关键是在确定了n后,如何指定一个k,指定了一个 k也就确定了一个检验方案,它定得是否恰当关系到甲乙双方的利益。直观上容易想到,k定的越小,条件对乙方就越苛刻,反之k定的越大,条件对乙方就越宽松,因此确定检验方案应有一种公认的标准,而这种标准应体现客观、公正和科学的原则。统计假设检验的理论为这种标准的建立提供了科学依据。

例7.1.1(续2) 为说明标准是如何建立起来的,我们先来看在不同的检验方案 (不同的n和k)下产生的检验结果的实际含义是什么。指定n为100,考虑“当样品中次品数达到k个时,就拒绝假设H;否则就接受假设H”的检验方案。 A=“样品中次品达到k” = “拒绝H” A =“样品中次品未达到k” = “接受H”

)  P  ( A 表示次品率为p时A发生的概率  p (次品率为p时H被拒绝的概率) )  P  (A )= 1 - P  ( A 表示次品率为p时 A 发生的概率  p p  (次品率为p时H被接受的概率)显然,对 0<p<1和 0<k<100这两种概率都不等于0,因此当H正确时(p≤1%),有可能因A发生而错误地拒绝H当H不正确时(p>1%),有可能因 A 发生而错误地接受H 在任何情况下,你无法确保不犯错误。也无法使犯两种错误的概率都减小到最低限度。

例7.1.1(续3) 在实际中,人们是根据如下准则来确定k:为体现对乙方利益的保护或者是甲方的诚意,通常由甲乙双方商定一个适当的临界值α,限制H错误地被拒绝的概率不能超过事先给定的α,即 sup  P p  ( A )£ a由于p £ 0 . 01 

æ100 ö j  Pp ( A = åç )÷ p  (  - p  100 - j ç j ÷ 1  )  j = k èø100 

(7.1.1)

为p的增函数,因此只需从 P  . 01  ( A )£  a 0即可确定k,从而最终确定检验方案。比如,若α=5%,k=? )  . 由于,当k=2时 P0. 01 ( A = 0 268 

)  . 当k=3时 P . 01 ( A = 0 023  0所以,对α=5%,  k=3 

7.1.2假设统计假设检验方法在实际中有广泛的应用,除了以上有关产品质量检验的例子外,还可举出很多其它方面的例子。比如一种新药是否比原有的药更有效某因素是否对产品质量有显著影响虽然贯穿统计假设检验理论的那种独特思维方式有助于人们判断现实中的许多假设,但并非所有现实中的假设都能用统计假设检验方法来检验,只有那些需要用数据来判断真伪的假设才可能用统计假设检验方法来检验。在用统计假设检验方法检验实际问题时首先这个问题要能纳入一个适当的统计模型­­­­总体或样本分布族。记这个分布族为:F其次在这个模型框架中,要检验的假设要能表为分布族 F的真子分布族F0,并简记为“ H:F∈ F0 ”。

参数假

设与非参数假设若分布族F的类型已知,未知的只是其中的一个或几个参数,统计假设只与这些未知参数有关,我们称为参数假设。并称此类假设检验问题为参数假设检验问题。若记 F ={F ,θ∈Θ}, F 0 ={F ,θ∈Θ },则参数假θ θ  0 设可简记为“H:θ∈Θ ”。 0 若总体分布的类型未知,在这种情况下往往需要直接针对总体分布的具体形式或总体分布的某些特征提出假设,我们称此类假设为非参数假设。并称此类假设检验问题为非参数假设检验问题。

例7.1.2 随机抽测了 50 名 2000 年 1 月出生的男婴的体重,希望确定男婴的体重 X 是否服从正态分布。F ( x :X 的分布函数 ) 假设:F ( x 是 N  m  s 2  ) , 

(

单参数假设与多单参数假设在参数假设检验问题中,总体中可能有多个未知参数,如果实际问题只需对其中某一个参数提出假设并进行检验,则称这类参数假设为单参数假设,相应的假设检验问题称为单参数假设检验;如果实际问题需要对多个参数一起提出一个假设并进行检验,则称这类参数假设为多参数假设,相应的假设检验问题称为多单参数假设检验。

零假设与备择假设在统计中要“检验”一个假设H,就是在这个假设H成立的前提下,依据样本观测结果来判断这个前提能否有充分的理由站得住脚,从而决定是接受它还是拒绝它。我们称这类作为检验前提的假设为“零假设”或“原假设”(null hypothesis),并简记为 “H :θ∈Θ ”。 0  0 当零假设被拒绝时,从逻辑上讲就意味着接受一个与之对立的假设。我们称与零假设对立的假设为“备择假设”或“对立假设”  (alternative hypothesis),并记为 “H :θ∈Θ\Θ ”。这样的 1  0 假设可称为“逻辑对立假设” 在某些应用中,拒绝零假设不一定意味着接受逻辑对立假设,而可能是意味着接受一个特定的假设“H :θ∈Θ ”,其中Θ  1  1  1 为Θ\Θ 的真子集。 0 

假设检验问题的表示由此可见,在假设检验中不仅要明确什么是零假设,而且还要明确备择假设是什么。因此一个假设检验问题通常表示为 

H 0 : q Î Q 0  vs  H : qÎ Q1  1 设时也可以不写出来。比如,例7.1.1中的假设检验问题可表示为 H 0:£ 1  p %  vs  H 1 :p > 1 % 

(7.1.2)

其中 Q 0 È Q1 Ì Q,Q 0 Ç Q1 = f。当备择假设是逻辑对立假

H 0:£ 1  p % 

又如,例7.1.2的假设检验问题 

(,  ( H 0 :  (x) 是N  m  s 2 ) v  H 1 :F (x) 不是N  m,  s 2 )  F  s 或

H 0:F (x)是N ( m,s 2 )

零假设与备择假设的区别在假设检验问题中,零假设和备择假设是一

对相互排斥的假设,从实际问题的背景来讲,区分零假设和备择假设是非常重要的。由于零假设是作为检验前提而提出来的,因此零假设通常应该是受到保护的,没有充足的证据是不能被拒绝的。而只有在零假设被拒绝时才能接受备择假设,因此零假设与备择假设不是处于同等地位。从相反的角度看,备择假设可能是我们真正感兴趣的,接受备择假设可能意味着得到有某种特别意义的结论,或意味着采取某种重要决断。因此对备择假设应取慎重态度,没有充足的证据不能轻易接受。

7.1.3 检验和检验统计量假设检验问题的共同点是:对总体分布函数的类型或总体分布函数中的未知参数提出假设(零假设),希望通过抽样并根据样本提供的信息对零假设是否成立进行推断。称依据样本观测结果(样本点)来判断接受还是拒绝零假设的准则为检验。用数学语言来讲,一个检验就是样本空间X (所有样本点的集合) {的一个划分:W , W } ,其中 W U W = X ,  W I W = f。当样本点落入W中时就拒绝H  (接受H  );当样本点落入 W 中时 0  1 就接受H  (拒绝H  )。我们称W为“拒绝域”, W为“接受域”。  0  1 检验的这个定义过于一般,我们不能从这个定义中得到任何构造合理检验的指导原则。实际中一般使用能够衡量样本点与零假设之间偏离程度的统计量来构造检验。称用来构造检验的统计量为检验统计量。对例7.1.1的假设检验问题H 0:£ 1  v  H :p > 1  p %  s  1 % 

记T=样品中次品数,使用这个统计量,检验可表示为 拒绝域:W={ T≥k } 接受域: W ={ T<k }; 

7.1.4 两类错误概率和检验的水平由于样本点可能取到样本空间 X 中的任何一个点,因此当我们用一个检验{ W , W } 来检验假设

H 0 : q Î Q 0  vs  H 1 : qÎ Q1 时,检验的结论未必总是正确的。如零假设 H 0 事实上是成立的,但却因样本观测值落入拒绝域而拒绝了零假设 H 0 ,这便犯了弃真的错误,通常称为第一类错误;相反,如果零假设  H 0 不成立,却因样本观测值落入接受域而接受了零假设 H 0 ,这便犯了存伪的错误,通常称为第二类错误。 … 第一类错误概率≡a(q) =Pq{(X1, ,Xn)∈W}

q∈Q0 

第二类错误概率≡ b(q) = P { ( X 1 , L, X n )Î W }  q … =1-Pq{(X1, ,Xn)∈W}

q∈Q1

例7.1.1(续4) 对例7.1.1的假设检验问题H 0:£ 1  v  H :p > 1  p %  s  1 % 

记T=样品中次品数,对检验拒绝域:W={ T≥2 }   接受域: ={ T< 2}  W …  a(p) =Pp{(X1, ,Xn)∈W}=  P { T ³ 2}  p

= 1 - (1 - p )

100

( - 100 p 1 - p )

99 

( p £ 0 . 01  ) 

£ 0.  268  ( p= 0 01  .  ) b(p) = P { ( X 1 , L, X n  )ΠW }  p

=  P { T £ 1}  p= (1 - p )100

(+ 100 p 1 - p )

99 

( p > 0 . 01  ) 

£ 0.  732  ( p = 0 01  .  ) 

例7.1.1(续5) 对检验拒绝域:W={ T≥3 }   接受域: ={ T< 3 }  W …  a(p) =Pp{(X1, ,Xn)∈W}

=  P { T ³ 3}  p= 1 - (1 - p )100

( ) - 100 p 1 - p )­ 100 × 99p  (1 ­ p 2

99 

98 

( p £ 0 . 01  ) 

£ 0.  023  ( p= 0 01  .  ) b(p) = P { ( X 1 , L, X n  )ΠW }  p

=  P { T £ 2}  p= (1 - p )100

( )+ 100 p 1 - p )+ 100 × 99p 2 (1 ­ p 

99 

98 

( p £ 0 . 01  ) 

£ 0.  977  ( p= 0 01  .  ) 

检验的水平显然,两类错误的概率可作为衡量一个检验好坏的标准。对于一个检验,我们自然希望犯两类错误的概率都尽可能小,但这显然是不可能的。…  a(q) =Pq{(X1, ,Xn)∈W} q∈Q0…  b(q) =1-Pq{(X1, ,Xn)∈W} q∈Q1依据保护零假设的原则,犯第一类错误的概率,即错误地拒绝零假设的概率,应该受到限制。或者我们可以反过来讲,从慎重接受备择假设的考虑出发,错误地接受备择假设的概率应该受到限制。奈曼—皮尔逊(Neyman­Pearson)在限制第一类错误概率不超过事先给定的一个小的正数α,即

sup P { ( X 1 , , X n )Î W }£ a L qq  Q0 Î

(7.1.3) 

的约束条件下,建立了一套衡量检验优良性的理论。对奈曼— 皮尔逊的理论,我们不准备在此介绍。 

本文来源:https://www.bwwdw.com/article/gxxq.html

Top