质量专业基础理论与实务 初级

更新时间:2023-04-24 17:02:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

质量专业理论与实务

第一章概率统计基础知识

第一节质量特性数据的统计规律

一、总体、个体与样本

产品的质量可以用一个或多个质量特性来表示。这里的特性可以是定量的,也可以是定性的。例如灯泡的寿命,钢的成分等都是定量特性;而按规范判定产品为“合格”或“不合格”,则是一种定性特征。

在质量管理中,通常研究一个过程中生产的全体产品。在统计中,将研究、考察对象的全体称为总体。例如某个工厂在一个月内按照一定材料及一定工艺生产的一批灯泡。总体是由个体组成的。在上例中,这批灯泡中的每个特定的灯泡都是一个个体。如果总体中包含的个体数不大,而对产品质量特性的观测(例如测量)手段不是破坏性的,工作量也不大,那么有可能对总体中的每个个体都进行观测,以得到每个个体的质量特性值。但是如果总体中的个体数N很大,甚至是无限的,或者观测是破坏性的或观测的费用很大,那么不可能对总体中的每个个体都进行观测。通常的做法是从总体中抽取一个或多个个体来进行观测。抽出来的这一部分个体组成一个样本,样本中所包含的个体数目称为样本量。通过对样本的观测来对总体特性进行研究,是统计的核心。

上述总体、个体和样本的概念是统计的基本概念,从上面的叙述中,这些概念都可以是具体的产品。但有时为了表达的方便,当研究产品某个特定的质量特性X时,也常把全体产品的特性看做为总体,而把一个具体产品的特性值x视为个体,把从总体中抽出的由n个产品的特性值x1,x2,…,x n看做为一个样本。

[例1.1-1]从一个工厂一个月内生产的一批灯泡中抽取n=8个灯泡,进行寿命试验,得到这8个灯泡的使用寿命为(单位为小时): 325,84,1244,870,645,1423,1071,992 这8个灯泡或相应的使用寿命即为一个样本,样本量n=8。

1

质量专业理论与实务

从总体中抽取样本的方法称为抽样。为使抽取的样本对总体有代表性,样本不能是有选择的,最好应是随机抽取的,关于这一点,以后我们还要详细解释。

二、频数(频率)直方图及累积频数(频率)直方图

为研究一批产品的质量情况,需要研究它的某个质量特性(这里为了叙述简单起见,仅讨论一个质量特性,有必要时也可以同时讨论多个质量特性)X的变化规律。为此,从这批产品(总体)中抽取一个样本(设样本量为n),对每个样本产品进行该特性的测量(观测)后得到一组样本观测值,记为x1,x2,…,x n,这便是我们通常说的数据。

为了研究数据的变化规律,需要对数据进行一定的加工整理。直方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。下面用一个例子来说明直方图的概念及其作法。

〔例1.1-2]食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取100个进行称量,获得罐头的净重数据如下:

为了解这组数据的分布规律,对数据作如下整理:

(1)找出这组数据中的最大值x max及最小值x min,计算它们的差R=x max-x min,R称为极值,也就是这组数据的取值范围。在本例中x max=356,x min=332,从而R=356-332=24。

2

质量专业理论与实务

(2)根据数据个数,即样本量n,决定分组数k及组距h。

一批数据究竟分多少组,通常根据n的多少而定,不过这也不是绝对的,表1.1-1是可以参考的分组数。

选择k的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。

每一组的区间长度,称为组距。组距可以相等,也可以不相等。组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距。对于完全相等的组距,通常取组距h为接近R/k的某个整数值。

在本例中,=100,取k=9,R/k=24/9=2.7,故取组距h=3。

(3)确定组限,即每个区间的端点及组中值。为了避免一个数据可能同时属于两个组,因此通常将各组的区间确定为左开右闭的: (a0,a1],(a1,a2],…,(a k-1,ak]通常要求a0x max。在等距分组时,a1=a0+h,a2=a1+h,…,a k=a k-1+h,而每一组的组中值

在本例中取a0=331.5,则每组的组限及组中值见表1.1-2。

(4)计算落在每组的数据的频数及频率

确定分组后,统计每组的频数,即落在组中的数据个数n i以及频率f i=n i/n,列出每组的频数、频率表,见表1.1-2。

3

(5)作频数频率直方图

在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形,所得的图形称为频数(频率)直方图,如图 1.1-1。到在本例中频数直方图及频率直方图的形状是完全一致的。这是因为分组是等距的。

在分组不完全等距的情形,在作频率直方图时,应当用每个组的频率与组距的比值f i/h i为高作矩形。此时以每个矩形的面积表示频率。

(6)累积频数和累积频率直方图

还有另一种直方图使用的是累积频数和累积频率。以累积频率直方图为例,首先要计算累积频率F i,F i是将这一组的频率与前面所有组的频率累加,也即第1组的F1=f1,第2组的F2=f1+f2,一般的,F i=f j。本例中的各组F i值也见表1.1-2。

如果以每组的累积频率F i为高作矩形,所得的直方图称为累积频率直方图,本例中的累积频率直方图如图1.1-2所示。

可以从直方图获得数据的分布规律,其中包含数据取值的范围,以及它们的集中位置和分散程度等信息。

4

应当引起注意的是,如果我们观测的数据量(即样本量)n很大,而分组又很细,那么从频率直方图及累积频率直方图可以分别得到一根光滑曲线,关于这一点我们将在本章第三节详细讨论。

三、数据集中位置的度量

5

质量专业理论与实务

6 对一组样本数据,可以用一些量表示它们的集中位置。这些量中,常用的有样本均值、样本中位数和样本众数。

(一)样本均值

样本均值也称样本平均数,记为,它是样本数据x 1,x 2,…,x n 的算术平均数:

[例 1.1-3]轴直径的一个n=5的样本观测值(单位:cm)为:15.09,15.29,15.15,15.07,15.21,则样本均值为:

=15.09+15.29+15.15+15.07+15.21)=15.162 对于n 较大的分组数据,可利用将每组的组中组x 'i 用频率f i 加权计算近似的样本均值:

〔例1.1-4]在例11.2中,100个罐头的净量的均值按分组计算为:

=333×0.01十336×0.04十339×0.11+…+357×0.01 =34508/100=345.08

样本均值是使用最为广泛的反映数据集中位置的度量。它的计算比较简单,但缺点是它受极端值的影响比较大。

(二)样本中位数

样本中位数是表示数据集中位置的另一种重要的度量,用符号Me

或表示。在确定样本中位数时,需要将所有样本数据按其数值大小从小到大重新排列成以下的有序样本:

x (1),x (2),…,x (n)其中x (1)=x min ,x (n)=x max 分别是数据的最小值与最大

值。

样本中位数定义为有序样本中位置居于中间的数值,具体地说:

质量专业理论与实务

〔例1.1-5]对例1.1-3中的5个轴直径数据进行按从小到大的重新排序,得到如下有序样本:

15.07,15.09,15.15,15.21,15.29 这里n=5为奇数,(n+1)/2=3,因而样本中位数Me=x(3)=15.15。

注意,在此例中,中位数15.15与均值15.162很接近。

与均值相比,中位数不受极端值的影响。因此在某些场合,中位数比均值更能代表一组数据的中心位置。

(三)样本众数

样本众数是样本数据中出现频率最高的值,常记为Mod。例如对例1.1-2中的罐头净量,100个数据中,344出现的次数最多,为12次,因此Mod=344。样本众数的主要缺点是受数据的随机性影响比较大,而且对大的n,也很难确定,有时也不惟一,此时较多地采用分组数据。在本例中第5组(343.5,346.5]的频率为0.30,是所有组中最高的,因而该组的组中值345可以作为众数的估计。注意到该数与前面定的344相差不大。

四、数据分散程度的度量

一组数据总是有差别的,对一组质量特性数据,大小的差异反映质量的波动。也有一些用来表示数据内部差异或分散程度的量,其中常用的有样本极差、样本方差、样本标准差和样本变异系数。

(一)样本极差

样本极差即是样本数据中最大值与最小值之差,用R表示。对于有序样本,极差R为:

R=x(n)-x(1)(1.1-4)

例如在例1.1-3,5个轴直径数据的极差R=15.21-15.09=0.12。

样本极差只利用了数据中两个极端值,因此它对数据信息的利用不够充分,极差常用于n不大的情况。

(二)样本方差与标准差

数据的分散程度可以用每个数据x i 离其均值的差x i -来表示,x i -称为x i的离差。对离差不能直接取平均,因为离差有正有负,取平均会正负相抵,无法反映分散的真实情况。当然可以先将其取绝对值,再进行平均,这就是平均绝对差:

7

质量专业理论与实务

但是由于对绝对值的微分性质较差,理论研究较为困难,因此平均绝对差使用并不广泛。使用最为广泛的是用离差平方来代替离差的绝对值,因而数据的总波动用离差平方和

来表示,样本方差定义为离差平方和除以n-1,用s2表示:

因为n个离差的总和为0,所以对于n个独立数据,独立的离差个数只有n-1个,称n-1为离差(或离差平方和)的自由度,因此样本方差是用n-1而不是用n除离差平方和。

样本方差正的算术平方根称为样本标准差,即:

注意标准差的量纲与数据的量纲一致。

在具体计算时,离差平方和也可用以下两个简便的公式:

因此样本方差计算可用以下公式:

8

质量专业理论与实务

对例1.1-3的轴直径数据,离差平方和、样本方差及样本标准差的计算可列表进行。

为计算方便,可以将数据减去一个适当的常数,这样不影响样本方差及标准差的计算结果。例如,在本例中,将每个数据减去15,即可大大减少计算量。在实际使用中还可以利用计算器来计算,特别是许多科学计算用的计算器,都具有平均数、方差与标准差的计算功能。(三)样本变异系数

样本标准差与样本均值之比称为样本变异系数,有时也称之为相对标准差,记为cv:

例如对例 1.1-2的轴直径数据,样本变异系数cv=0.0901/15.162=0.0059。

第二节概率基础知识

9

质量专业理论与实务

一、事件与概率

(一)随机现象

在一定条件下,并不总是出现相同结果的现象称为随机现象。从这个定义中可看出,随机现象有两个特点:

(1)随机现象的结果至少有两个;

(2)至于哪一个出现,人们事先并不知道。

抛硬币、掷骰子是两个最简单的随机现象。抛一枚硬币,可能出现正面,也可能出现反面,至于哪一面出现,事先并不知道。又如掷一颗骰子,可能出现1点到6点中某一个,至于哪一点出现,事先也并不知道。

〔例1.2-1]随机现象的例子:

(1)一天内进入某超市的顾客数;

(2)一顾客在超市中购买的商品数;

(3)一顾客在超市排队等候付款的时间;

(4)一颗麦穗上长着的麦粒个数;

(5)新产品在未来市场的占有率;

(6)一台电视机从开始使用到发生第一次故障的时间;

(7)加工机械轴的直径尺寸;

(8)一罐午餐肉的重量。

随机现象在质量管理中到处可见。

认识一个随机现象首要的是能罗列出它的一切可能发生的基本结果。这里的基本结果是指今后的抽样单元,故又称样本点,随机现象一切可能样本点的全体称为这个随机现象的样本空间,常记为Ω。

“抛一枚硬币”的样本空间Ω={正面,反面};

“掷一颗骰子”的样本空间Ω={1,2,3,4,5,6};

“一顾客在超市中购买商品件数”的样本空间Ω={0,1,2,…};

“一台电视机从开始使用到发生第一次故障的时间”的样本空间Ω={t:t≥0};

“测量某物理量的误差”的样本空间Ω={x:-∞

(二)随机事件

10

质量专业理论与实务

随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母A、B、C等表示,如在掷一颗骰子时,“出现奇数点”是一个事件,它由1点、3点、5点共三个样本点组成,若记这个事件为A,则有A={1,3,5}。

1.随机事件的特征

从随机事件的定义可见,事件有如下几个特征:

(1)任一事件A是相应样本空间Ω中的一个子集。在概率论中常用一个长方形示意样本空间Ω,用其中一个圆(或其他几何图形)示意事件A,见1.2-1,这类图形称为维恩(Venn)图。

(2)事件A发生当且仅当A中某一样本点发生,若记ω1,ω2是Ω中的两个样本点(见图1.21):

当ω1发生,且ω1∈A(表示ω1在A中),则事件A发生;

当ω2发生,且ω2A(表示ω2不在A中),则事件A不发生。

(3)事件A的表示可用集合,也可用语言,但所用语言应是明确无误的。

(4)任一样本空间Ω都有一个最大子集,这个最大子集就是Ω,它对应的事件称为必然事件,仍用Ω表示。如掷一颗骰子,“出现点数不超过6”就是一个必然事件。

(5)任一样本空间Ω都有一个最小子集,这个最小子集就是空集,它对应的事件称为不可能事件,记为φ。如掷一颗骰子,“出现7点”就是一个不可能事件。

[例1.2-2]若产品只区分合格与不合格,并记合格品为“0”,不合格品为“1”。则检查两件产品的样本空间Ω由下列四个样本点组成。

11

质量专业理论与实务

Ω={(0,0),(0,1),(1,0),(1,1)}其中样本点(0,1)表示第一件产品为合格品,第二件产品为不合格品,其他样本点可类似解释。下面几个事件可用集合表示,也可用语言表示。

A=“至少有一件合格品”={(0,0),(0,1),(1,0)};

B=“至少有一件不合格品”={(0,1),(1,0),(1,1)}C=“恰好有一件合格品”={(0,1)(1,0)};

Ω=“至多有两件合格品”={(0,0),(0,1),(1,0),(1,1)};

φ=“有三件不合格品”。

现在我们转入考察“检查三件产品”这个随机现象,它的样本空间Ω含有23=8个样本点。

Ω={(0,0,0),(0,0,1),(0,1,0),(1,0,0),(0,1,1),(1,0,1),(1,1,0),(1,1,1)}

下面几个事件可用集合表示,也可用语言表示。

A=“至少有一件合格品”={Ω中剔去(1,1,1)的其余7个样本点};

B=“至少有一件不合格品”={Ω中剔去(0,0,0)的其余7个样本点};

C1=“恰有一件不合格品”={(0,0,1),(0,1,0),(1,0,0)};

C2=“恰有两件不合格品”={(0,1,1),(1,0,1),(1,1,0)};

C3=“全是不合格品”={(1,1,1)};

C0=“没有一件是不合格品”={(0,0,0)};

2.随机事件之间的关系

实际中,在一个随机现象中常会遇到许多事件,它们之间有下列三种关系。

(1)包含:在一个随机现象中有两个事件A与B,若事件A中任一个样本点必在B中,则称A被包含在B中,或B包含A,记为A B,或B A,这时事件A的发生必导致事件B发生,如图1.2-2所示。如掷一颗骰子,事件A=“出现4点”必导致事件B=“出现偶数点”的发生,故A B。显然,对任一事件A ,有ΩAφ。

(2)互不相容:在一个随机现象中有两个事件A与B,若事件A与B没有相同的样本点,则称事件A与B互不相容。这时事件A与B不可能同时

12

质量专业理论与实务

发生,如图1.2-3所示,如在电视机寿命试验里,“电视机寿命小于1万小时”与“电视机寿命超过4万小时”是两个互不相容事件,因为它们无相同的样本点,或者说,它们不可能同时发生。

两个事件间的互不相容性可推广到三个或更多个事件间的互不相容,例如在检查三个产品的例子(例1.2-2)中,C1=“恰有一件不合格品”,C2=“恰有两件不合格品”,C3=“全是不合格品”,C0=“没有不合格品”是四个互不相容事件。

(3)相等:在一个随机现象中有两个事件A与B,若事件A与B含有相同的样本点,则称事件A与B相等,记为A=B。如在掷两颗骰子的随机现象中,其样本点记为(x,y,其中x与y分别为第一与第二颗骰子出现的点数,定义如下两个事件:

A={(x,y):x+y=奇数}

B={(x,Y):x与y的奇偶性不同}可以验证A=B。

(三)事件的运算事件的运算有下列四种。

(1)对立事件,在一个随机现象中,Ω是样本空间,A为事件,由在Ω中而不在A中的样本点组成的事件称为A 的对立事件,记为。图1.2-4上的阴影部分就表示A 的对立事件。可见就是“A不发生”,例如在检查一匹布中,事件“至少有一个疵点”的对立事件是“没有疵点”。对立事件是相互的,A 的对立事件是,的对立事件必是A。特别,必然事件Ω与不可能事件φ互为对立事件,即=φ,=Ω。

13

14 (2)事件A 与B 的并,由事件A 与B 中所有样本点(相同的只计入一次)组成的新事件称为A 与B 的并,记为AUB 。如图1.2-2所示。并事件A ∪B 发生意味着“事件A 与B 中至少一个发生”。

(3)事件A 与B 的交,由事件A 与B 中公共的样本点组成的新事件称为事件A 与B 的交,记为A ∩B 或AB 。如图1.2-6所示,交事件AB 发生意味着“事件A 与

B 同时发生”。

事件的并和交可推广到更多个事件上去(见图

1.2-7)。

质量专业理论与实务

(4)事件A对B的差,由在事件A中而不在B中的样本点组成的新事件称为A对B的差,记为A-B。如图1.1-8所示。

(四)概率——事件发生可能性大小的度量

随机事件的发生与否是带有偶然性的。但随机事件发生的可能性还是有大小之别,是可以设法度量的。而在生活、生产和经济活动中,人们很关心一个随机事件发生的可能性大小。例如:

(1)抛一枚硬币,出现正面与出现反面的可能性各为1/2。足球裁判就是用抛硬币的方法让双方队长选择场地,以示机会均等。

(2)某厂试制成功一种新止痛片在未来市场的占有率是多少呢?市场占有率高,就应多生产,获得更多利润;市场占有率低,就不能多生产,否则会造成积压,不仅影响资金周转,而且还要花钱去贮存与保管。

(3)购买彩券的中奖机会有多少呢?如1993年7月发行的青岛啤酒股票的认购券共出售287347740张,其中有180000张认购券会中签,中签率是万分之6.264(见1993年7月30日上海证券报)。

上述正面出现的机会、市场占有率、中签率以及常见的废品率、命中率等都是用来度量随机事件发生的可能性大小。一个随机事件A发生可能性的大小用这个事件的概率P(A)来表示。概率是一个介于0到1之间的数。概率愈大,事件发生的可能性就愈大;概率愈小,事件发生的可能性也就愈小。特别,不可能事件的概率为0,必然事件的概率为1,即: P(φ)=0,P(Ω)=1

二、概率的古典定义与统计定义

确定一个事件的概率有几种方法,这里介绍其中两种最主要的方法,相应于概率的两种定义,即古典定义及统计定义。

(一)古典定义

15

质量专业理论与实务

用概率的古典定义确定概率方法的要点如下:

(1)所涉及的随机现象只有有限个样本点,设共有n个样本点;

(2)每个样本点出现的可能性是相同的(等可能性);

(3)若被考察的事件A含有k个样本点,则事件A的概率定义为:

〔例1.2-3]掷两颗骰子,其样本点可用数对(x,y表示,其中x与y 分别表示第一与第二颗骰子出现的点数。这一随机现象的样本空间为: Ω={(x,y),x,y=1,2,3,4,5,6}它共含36个样本点,并且每个样本点出现的可能性都相同。

(1)定义事件A=“点数之和为2”={(1,1)},它只含一个样本点,故P(A)=1/36。

(2)定义事件B=“点数之和为5”={(1,4),(2,3),(3,2),(4,1)},它含有4个样本点,故P(B)=4/36=1/9。

(3)定义事件C=“点数之和超过9”={(4,6),(5,5),(6,4),(5,6),(6,5),(6,6)},它含有6个样本点,故P(C)=6/36 =1/6。

(4)定义事件D=“点数之和大于3,而小于7”={(1,3)(2,2),(3,

1),(1,4)(2,3),(3,2),(4,1),(1,5),(2,4),(3,3),(4,

2),(5,1)},它含有12个样本点,故它的概率P(D)=12/36 =1/3。

用古典方法获得概率常需要排列与组合的公式。现概要介绍如下:

排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。

16

质量专业理论与实务

(1)乘法原理:如果做某件事需经k步才能完成,其中做第一步有m1种方法,做第二步有m2种方法,…,做第k步有m k种方法,那么完成这件事共有m1×m2×…×m k种方法。

例如,甲城到乙城有3条旅游线路,由乙城到丙城有2条旅游线路,那么从甲城经乙城去丙城共有3×2=6条旅游线路。

(2)加法原理:如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有m1种完成方法,在第二类方法中又有m2种完成方法,…,在第k类方法中又有m k种完成方法,那么完成这件事共有m1+m2+…+m k种方法。

例如,由甲城到乙城去旅游有三类交通工具:汽车、火车和飞机,而汽车有5个班次,火车有3个班次,飞机有2个班次,那么从甲城到乙城共有5+3+2=10个班次供旅游选择。

(3)排列:从n个不同元素中任取r(r≤n)个元素排成一列称为一个排列。按乘法原理,此种排列共有n×(n-1)×…×(n-r+1)个,记为P'n。若r=n,称为全排列,全排列数共有n!个,记为P n,即:

P'n=n(n-1)…(n-r+1),p n=n!

(4)重复排列:从n个不同元素中每次取出一个作记录,放回后再取下一个,如此连续取r次所得的排列称为重复排列。按乘法原理,此种重复排列共有n'个。注意,这里的r允许大于n。

例如,从10个产品中每次取一个做检验,放回后再取下一个,如此连续抽取4次,所得重复排列数为104。假如上述抽取不允许放回,列所得排列数为10×9×8×7=5040。

(5)组合:从n个不同元素中任取r(r≤n)个元素并成一组(不考虑其间顺序)称为一个组合,此种组合数为:

规定0!=1,因而

=1。

17

质量专业理论与实务

18 例如,从10个产品中任取4个做检验,所有可能取法是从10个中任取4个的组合数,则不同取法的种数为:

这是因为取出的4个产品的全排列有4!=24种。这24种排列在组合中只算一种。

〔例1.2-4]一批产品共有

N 个,其中不合格品有M 个,现从中随机取出n 个(n ≤N),问事件A m

=“恰好有m 个不合格品”的概率是多少?

从N 个产品中随机抽取n 个共有

个不同的样本点,它们组成这个问题的样本空间Ω。其中“随机抽取”必导致这

个样本点是等可能的。以后对“随机抽取”一词都可作同样理解。下面我们先计算事件A 0、A 1的概率,然后计算一般事件A m 的概率。

事件A 0=“恰好有0个不合格品”=“全是合格品”。要使取出的n 个

产品全是合格品,那必须从该批中N-M 个合格品中抽取,这有

种取法。故事件A 0的概率为

事件A 1=“恰好有1个不合格品”,要使取出的n 个产品只有一个不合格

品,其他n-1个是合格品,可分二步来实现。第一步从M 个不合格品中随机取出1个,共有

19 种取法;第二步从NM 个合格品中随机取出

n-1个,共有

种取法。依据乘法原则,事件A

1共含

个样本点。故事件A

1的概率为:

最后,要使事件A m 发生,必须从M 个不合格品中随机抽取m 个,而从

N-M

个合格品中随机抽取n-m

个。依据乘法原则,事件A m 共含有

个样

本点。故事件A

m 的概率是:

其中r=min(n ,M)是m 的最大取值,这是因为m 既不可能超过取出的产品数n ,也不可能超过不合格品总数M ,即m≤n 和m≤M。综合这两个不等式,可知m≤min(n,M)=r 。 假如给定N=10,M=2和n=4,下面来计算诸事件A m 的概率:

而A3,A4等都是不可能事件。因为10个产品中只有2个不合格品,而要从中抽出3个或4个不合格品是不可能的。

[例1.2-5](放回抽样)抽样有两种形式:不放回抽样与放回抽样。上例讨论的是不放回抽样,每次抽取一个,不放回,再抽下一个,这相当于n 个同时取出。因此可不论其次序。放回抽样是抽一个,将其放回,均匀混合后再抽下一个。这时要讲究先后次序,现对上例采取放回抽样方式讨论事件B m=“恰好有m个不合格品”的概率。

从N个产品中每次随机抽取一个,检查后放回再抽第二个,这样直到抽出第n个产品为止。由于每次都有N种可能,故在放回抽样的问题中共有N n种等可能的样本点。

事件B0=“全是合格品”发生必须从N-M个合格品中用放回抽样方式随机抽取n次,它共含有(N-M)n种取法,故事件B0的概率为:

事件B1=“恰好有一件不合格品”发生,必须从N-M个合格品中用放回抽样抽取n-1次,而从M个不合格品中抽一次。这样就有M(N-M)n-1种取法。再考虑到不合格品出现次序(不合格品可能在第一次抽样出现,也可能在第二次抽样中出现,…,也可能在第n次抽样中出现)故B1所含样本点的个数共有nM(N-M)n-1。故事件B1的概率为:

20

质量专业理论与实务 21 类似地,事件B m 共含有

个样本点。其中组合数

是由于考虑到m 个不合格品在n 次放回抽样中出现的次序所致,故B m 发生的概率为:

特别,当m=n 时,P(B n )=(M/N)n 。 假如给定

N=10,M=2,n=4,在放回抽样场合来计算诸B m

的概率。先计算:

这是在一次抽样中,抽出不合格品的概率;

这是在一次抽样中,抽出合格品的概率。

于是诸B m 发生的概率为:

P(B 0)=0.84=0.4096

P(B 1)=4×0.2×0.83=0.4096

P(B 4)=0.24=0.0016

可见,在放回抽样中,B 0和B 1发生的可能性最大,而B 4发生的可能性

很小,B 4在1000次中发生还不到二次。

(二)统计定义

本文来源:https://www.bwwdw.com/article/jzoq.html

Top