概率专题教师.理科

更新时间:2023-07-18 15:31:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2011届高三数学二轮复习教案——概率与统计(理科)

一、高考考试基本内容:

离散型随机变量的分布列,离散型随机变量的期望值和平方差,抽样方法,总体分布的估计,正态分布,总体特征数的估计,线性回归。二、高考大纲要求:

⑴了解随机变量、离散型随机变量的意义,会求出某些简单的离散型随机变量的分布列

⑵了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。 ⑶会用抽机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。 ⑷会用样本频率分布去估计总体分布。 ⑸了解正态分布的意义及主要性质。 ⑹了解假设检验的基本思想。 ⑺会根据样本的特征数估计总体。 ⑻了解线性回归的方法。

三、高考复习目标

1. 了解典型分布列:0~1分布,二项分布,几何分布。

2. 了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。 3. 在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定

程度。

4. 了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。

5. 了解标准正态分布的意义和性质,掌握正态总体N( , )转化为标准正态总体N(0,1)的公式

2

F(x) (

x

)及其应用。

6. 通过生产过程的质量控制图,了解假设检验的基本思想。

7. 了解相关关系、回归分析、散点图等概念,会求回归直线方程。 8. 了解相关系数的计算公式及其意义,会用相关系数公式进行计算。 9. 了解相关性检验的方法与步骤,会用相关性检验方法进行检验。

四、基础知识再现

㈠随机事件和统计的知识结构:

㈡随机事件和统计的内容提要

1.主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。

2.随机变量的概率分布

散型随

的分布

两条基本性质①pi 0(i 1,2, );

(1)离机变量列:

②P1+P2+ =1。

(2)连续型随机变量概率分布:

由频率分布直方图,估计总体分布密度曲线y=f(x); 总体分布密度函数的两条基本性质: ①f(x) ≥0(x∈R);

②由曲线y=f(x)与x轴围成面积为1。 3.随机变量的数学期望和方差

(1)离散型随机变量的数学期望:

E x1p1 x2p2 ;反映随机变量取值的平均水平。 (2)离散型随机变量的方差:

2

D (x1 E )2p1 (x2 E )2p2 (xn E )pn ;反映随机变量取值的稳定与波动,集中与离散的程度。

(3)基本性质:E(a b) aE b;D(a b) aD 。 4.三种抽样方法。 5.二项分布和正态分布

(1)记ε是n次独立重复试验某事件发生的次数,则ε~B(n,p);

k

其概率Pn(k) Cnpkqn k(q 1 p,k 0,1,2, ,n)。

2

期望Eε=np,方差Dε=npq。 (2)正态分布密度函数: f(x)

12

e

(x )22 2

期望Eε=μ,方差D 2。 (3)标准正态分布: 若 ~N( , ),则 P( b) (

2

~N(0,1),

a

b

),

P(a b) (

b

) (

)。

6.线性回归:

当变量x取值一定时,如果相应的变量y的取值带有一定的随机性,那么就说变量y与x具有相关关系。对于它们的一组观测值来说,如果与之相应的在平面直角坐标系中的点大体上集中在一条直线的附近,就说变量y与x之间具有线性相关关系。 相关系数用来检验线性相关显著水平,通常通过查表取显著水平0.05自由度n-2的r0.05,若r r0.05为显著;否则为不显著。

㈢离散型随机变量的分布列

随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。随机变量最常见的两种类型,即离散型随机变量和连续型随机变量。如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量;如果随机变量可以取某一区间内的一切值,这样的随机

变量叫做连续型随机变量。

离散型随机变量的分布列:如果离散型随机变量 的可能取值为xi(i=1,2, ),由于试验的各个结果的出现有一定的概率,于是随机变量 取每一个值也有一定的概率P( =xi)=pi,人们常常习惯地

分布列的表达式可有如下几种:(1)表格形式;(2)一组等式;(3)压缩为一个带“i”的等式。 1.在实际问题中,人们常关心随机变量的特征,而不是随机变量的具体值。离散型随机变量的期望和方差都是随机变量的特征数,期望反映了随机变量的平均取值,方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度。其中标准差与随机变量本身有相同的单位。 2.离散型随机变量期望和方差的计算公式

设离散型随机变量 的分布列为P( =xi)=pi,i=1,2, ,则:

E =

xp,D = (x-E ) p= x

i i

i

2

i

i 1

i 1

i 1

2

i pi-(E )2=E( 2)-(E )2。

3.离散型随机变量期望和方差的性质

E (a +b)=aE +b,D (a +b)=a2 D 。 4.二项分布的期望与方差

若 ~B (n,p),则E =np,D =np (1-p)。 ㈣抽样方法

三种常用抽样方法及特点:

1.简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。

2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。

系统抽样的步骤可概括为:(1)将总体中的个体编号;(2)将整个的编号进行分段;(3)确定起始的个体编号;(4)抽取样本。

3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。

4.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽取的概率相等,体现了这三种抽样方法的客观性和公平性。若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每一个个体被抽到的概率都是

n。

N

㈤总体分布的估计

总体分布:总体取值的概率分布规律通常称为总体分布。

总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线。 ㈥正态分布

正态分布:如果总体密度曲线是以下函数的图象:

f(x)

12e

(x )22 2

,x ( , ) ①

式中的实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体。

2

其分布叫做正态分布,常记作N(μ,σ)。①的图象被称为正态曲线。

特别地,在函数①中,当μ=0,σ=1时,正态总体称为标准正态总体,这时,相应的函数 表达式是f(x)

12

e

x22

,x ( , ), ②

相应的曲线称为标准正态曲线。

当我们不知道一个总体的分布时,往往总是从总体中抽取一个样本,并用样本的频率分布去估计总体的分布,而且随着样本容量越大分组的组距越小,样本的频率分布就更加接近总体分布。当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线,即反映总体分布的总体密度曲线。可以知道,反映总体分布的总体密度曲线的形状是形形色色的,不同形状的总体密度曲线是不同总体分布的反映,而正态分布以及反映这种分布的正态曲线是异彩纷呈的总体分布及总体密度曲线中的一类重要分布。

1.正态曲线及其性质 对于正态分布函数: f(x)

12e

(x )22 2

,x∈(-∞,+∞)

由于中学知识范围的限制,不必去深究它的来龙去脉,但对其函数图像即正态曲线可通过描点(或计算机中的绘图工具)画出课本图1-4中的图(1)、(2)、(3),由此,我们不难自己总结出正态曲线的性质。 2.标准正态曲线

标准正态曲线N(0,1)是一种特殊的正态分布曲线,它是本小节的重点。由于它具有非常重要的地位,已专门制作了“标准正态分布表”。对于抽像函数 (x0) p(x x0),课本中没有给出具体的表达式,但其几何意义非常明显,即由正态曲线N(0,1)、x轴、直线x x0所围成的图形的面积。再由N(0,1)的曲线关于y轴对称,可以得出等式 (x0) 1 (x0),以及标准正态总体在任一区间(a,b)内取值概率P (b) (a)。

3.一般正态分布与标准正态分布的转化

由于一般的正态总体N( , )其图像不一定关于y轴对称,所以,研究其在某个区间(x1,x2)的概率时,无法利用标准正态分布表进行计算。这时我们自然会思考:能否将一般的正态总体N( , )转化成标准的正态总体N(0,1)进行研究。人们经过探究发现:对于任一正态总体N( , ),其取值小于x的概率F(x) (

2

2

2

x

)。

(七)、线性回归

回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。

回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一

a bx。其中 条直线的附近,就可以认为y对x的回归函数的类型为直线型:y

b

(x

i 1

n

n

i

x)(yi y)

i

xy

ii 1n

n

i

nxy

,a y bx。我们称这个方程为y对x的回归

(x

i 1

x)2

x

i 1

2i

nx

2

直线方程。 1.相关关系

研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识: (1)相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。例如正方形面积S与边长x之间的关系S x2就是函数关系。即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应。相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。例如人的身高与年龄;商品的销售额与广告费等等都是相关关系。

(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系。然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些。

(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性。而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。

相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况。因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度。 2.回归分析

本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型——一元线性回归分析。 对于线性回归分析,我们要注意以下几个方面:

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。

(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。 3.相关系数

有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方程。显然这种情形下求得的回归直线方程没有实际意义。那么,在什么情况下求得的回归直线方程才能对相应的一组观测数据具有代表意义?课本中不加证明地给出了相关系数的公式。相关系数公式的作用在于,我们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状粗浅地得出数据之间的线性相关程度。 4.线性相关性检验

相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性相关与否的具体办法。限于要求,中学阶段只要求掌握这种检验方法的操作步骤,而不要求对这种方法包含的原理进行深入研究。其具体检验的步骤如下:

(1)在课本中的附表3中查出与显著性水平0.05与自由度n-2(n为观测值组数)相应的相关系数临界值r0.05。

(2)根据公式r

xy

ii 1

n

2

i 1

n

i

nxy

n

计算r的值。

2

( xi2 nx)( yi2 ny)

i 1

(3)检验所得结果。

如果|r| r0.05,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设。

如果|r| r0.05,表明一个发生的概率不到5%的事件在一次试验中竟发生了。这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系。 有了相关性检验方法后,我们对一组数据作线性回归分析,只须先对这组数据的线性相关性进行检验。如若具有线性相关性,则可依据求回归直线方程的方法进行求解,而不必像前面那样,先画散点图,再依照散点图呈直线性后再求回归直线方程。这样就使得回归直线方程更能真实地反映实际情况,具有应用于实际的价值。

六、经典例题解析:

例1. 现有8名奥运会志愿者,其中志愿者A1,A2,A3通晓日语,B1,B2,B3通晓俄语,C1,C2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组. (Ⅰ)求A1被选中的概率;

(Ⅱ)求B1和C1不全被选中的概率.

解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间

(A1,B1,C2),(A1,B2,C1),(A1,B2,C2),(A1,B3,C1), {(A1,B1,C1),

(A1,B3,C2),(A2,B1,C1),(A2,B1,C2),(A2,B2,C1),(A2,B2,C2), (A2,B3,C1),(A2,B3,C2),(A3,B1,C1),(A3,B1,C2),(A3,B2,C1), (A3,B2,C2),(A3,B3,C1),(A3,B3,C2)}

由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的. 用M表示“A1恰被选中”这一事件,则

(A1,B1,C2),(A1,B2,C1), M {(A1,B1,C1),

(A1,B2,C2),(A1,B3,C1),(A1,B3,C2)}

事件M由6个基本事件组成, 因而P(M)

61

. 183

(Ⅱ)用N表示“B1,C1不全被选中”这一事件,则其对立事件N表示“B1,C1全被选中”这一事件,

(A2,B1,C1),(A3,B1,C1)},事件N有3个基本事件组成, 由于N {(A1,B1,C1),

所以P(N)

3115

,由对立事件的概率公式得P(N) 1 P(N) 1 18666

2221

,乙队中3人答对的概率分别为,,且各人正确与否相互之间没有3332

例2.甲乙两队参加奥运知识竞赛,每队3人,每人回答一个问题,答对者为本队赢得一分,答错得零分。假设甲队中每人答对的概率均为

影响.用ε表示甲队的总得分.

解:(Ⅰ)求随机变量ε分布列和数学期望;

(Ⅱ)用A表示“甲、乙两个队总得分之和等于3”这一事件,用B表示“甲队总得分大于乙队总得分”这一事件,求P(AB).

(Ⅰ)解法一:由题意知,ε的可能取值为0,1,2,3,且

21222

P( 0) C03 (1 )3 ,P( 1) C13 (1 )2 ,32733922428

P( 2) C23 ()2 (1 )3 ,P( 3) C33 ()3 .

339327

所以ε的分布列为

ε的数学期望为

1248 1 2 3 2. 279927

2

解法二:根据题设可知 ~B(3,)

3

Eε=0

因此ε的分布列为

2k2k22 kk

P( k) C3 () (1 ) C3 3,k 0,1,2,3.

333

22

因为 ~B(3,),所以E 3 2

33

k

(Ⅱ)解法一:用C表示“甲得2分乙得1分”这一事件,用D表示“甲得3分乙得0分”这一事件,所

以AB=C∪D,且C、D互斥,又

2 211121211 2

P(C) C23 ()2 (1 )

3 332332332 3

10 4, 3

21114

P(D) C23 ()2 ( ) 5,

33323

由互斥事件的概率公式得

P(AB) P(C) P(D)

1043434

5 4

3532433

解法二:用Ak表示“甲队得k分”这一事件,用Bk表示“已队得k分”这一事件,k=0,1,2,3由于事件A3B0,A2B1

为互斥事件,故事

P(AB)=P(A3B0∪A2B1)=P(A3B0)+P(A2B1).

211221112()3 (2 ) C233 ( 2 C12 2)32232333

34

.243

例3. 19、某初级中学共有学生2000名,各年级男、女生人数如下表:

(1)求x的值;

(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y 245,z 245,求初三年级中女生比男生多的概率。 解:(1)∵

x

0.19 2000

∴x=380

(2)初三年级人数为y+z=2000-(373+377+388+370)=500,

现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:

48

×500=12名 2000

(3)设初三年级女生比男生多的事件为A,初三年级女生男生数记为(y,z): 由(2)知y+z=500,且y,z∈N, 基本事件空间包含的基本事件有: (245,255)、(246,254)、(247,253)、 (255,245)共11个

事件A包含的基本事件有:(251,249)、(252,248)、(253,247)、(254,246)、(255,245)共5个 ∴P(A)=

5; 11

例4为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问

卷调查,6人得分情况如下:5,6,7,8,9,10。把这6名学生的得分看成一个总体。 (1)求该总体的平均数;

(2)用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本。求该样本平均数与总体平均数之差的绝对值不超过0.5的概率。 解:(Ⅰ)总体平均数为

1

(5 6 7 8 9 10) 7.5. 6

(Ⅱ)设A表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”.

从总体中抽取2个个体全部可能的基本结果有:(5,6),(5,7),(5,8),(5,9),(510),,(6,7),(6,8),

(6,9),(6,10),(7,8),(7,9),(7,9),(810),,(9,10).共15个基本结果. 10),(8,

事件A包括的基本结果有:(5, 9),(510),,(6,8),(6,9),(6,10),(7,8),(7,9).共有7个基本结果.所以所求的概率为

P(A)

7

. 15

1

与p,且乙投球2次均未命中2

例5.甲、乙两个篮球运动员互不影响地在同一位置投球,命中率分别为的概率为

1. 16

(Ⅰ)求乙投球的命中率p;

(Ⅱ)若甲投球1次,乙投球2次,两人共命中的次数记为 ,求 的分布列和数学期望. 解:(Ⅰ)设“甲投球一次命中”为事件A,“乙投球一次命中”为事件B 由题意得

1 P B 2 1 p 2

解得p

1 16

335

或(舍去),所以乙投球的命中率为

444

1131

(Ⅱ)由题设和(Ⅰ)知P A ,PA ,P B ,PB

2244

可能的取值为0,1,2,3,故

1 1 1

P 0 PAPB B

2 4 32

2

1

P 1 P A PB B C2P B PBPA

1 1 3117

2 2 4 44232

1 3 9

P 3 P A P B B

2 4 32

2

2

P 2 1 P 0 P 1 P 3

15

32

的分布列为

的数学期望E 0 1 2 3 2

32323232

例6. 对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度的数据如下: 甲:27,38,30,37,35,31; 乙:33,29,38,34,28,36。

根据以上数据,试判断他们谁更优秀。

分析:根据统计知识可知,需要计算两组数据的x与S*2,然后加以比较,最后再作出判断。 解: x甲

1

(27 38 30 37 35 31) 33, 6

15

S甲*2 [(27 33)2 (38 33)2 (30 33)2 (37 33)2 (35 33)2 (31 33)2]

1

5

94 18.8;

1

x乙 (33 29 38 34 28 36) 33,

6

S乙*2 [(33 33)2 (29 33)2 (38 33)2 (34 33)2 (28 33)2 (36 33)2]

1

5

76 15.2

∴x甲 x乙,S甲*2 S乙*2,

1

5

由此可以说明,甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀。

说明:S*2与S2作为总体方差的两个估计量,当样品容量不是很大时,S*2更接近 2,故在实际运用时,我们常用S*2去估计 2,但当容量较大时,S*2与S2则没有什么差别。

例7某射击测试规则为:每人最多射击3次,击中目标即终止射击,第i次击中目标得1~i(i 1,2,3)分,3次均未击中目标得0分.已知某射手每次击中目标的概率为0.8,其各次射击结果互不影响.

(Ⅰ)求该射手恰好射击两次的概率;

(Ⅱ)该射手的得分记为 ,求随机变量 的分布列及数学期望.

,2,3),则P(Ai) 0.8,P(Ai) 0.2, 解:(Ⅰ)设该射手第i次击中目标的事件为Ai(i 1P(AiAi) P(Ai)P(Ai) 0.2 0.8 0.16.

(Ⅱ) 可能取的值为0,1,2,3. 的分布列为

2

E 0 0.008 1 0.032 2 0.16 3 0.8 2.752

例8.设X~N( , ),且总体密度曲线的函数表达式为: f(x)

12e

x2 2x 1

4

,x∈R。

(1)求μ,σ;(2)求P(|x 1| 2)及P(1 2 x 1 22)的值。

2

分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。利用一般正态总体N( , )与标准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。 解: (1)由于f(x) 可知μ=1,

12e

x2 2x 1

4

12 2

e

(x 1)22(2)2

,根据一般正态分布的函数表达形式,

2,故X~N(1,2)。

(2)P(|x 1| 2) P(1 2 x 1 2)

F(1 2) F(1 2)

2 1 2 1 () ()

22

(1) ( 1)

2 (1) 1

2 0.8413 1 0.6826。

又P(1 2 x 1 22) F(1 22) F(1 2)

2

(2) ( 1)

(

22 1

) (

2 1

2

)

(2) (1) 1

0.9772 0.8413 1

0.8185。

说明:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。

例9.

(1)线性回归方程;

(2)估计使用年限为10年时,维修费用是多少?

分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。 解:(1

于是b

xy

ii 15i 1

5

i

5xy

2

xi2 5x

112.3 5 4 5

1.23, 2

90 5 4

a y bx 5 1.23 4 0.08。

∴线性回归方程为:y bx a 1.23x 0.08。

(2)当x=10时,y 1.23 10 0.08 12.38(万元) 即估计使用10年时维修费用是12.38万元。

说明:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。 ^

^

本文来源:https://www.bwwdw.com/article/h0p1.html

Top