高考数学一轮复习 11.1 抽样方法与总体分布的估计考点及自测 理 新人教A版

更新时间:2023-05-08 07:30:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第1讲抽样方法与总体分布的估计

【2014年高考会这样考】

1.考查三种抽样方法及其应用.

2.考查频率分布直方图中的相关计算(求解频率、频数等).

3.考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等).

对应学生

162

考点梳理

1.三种抽样方法的比较

2.频率分布直方图与茎叶图

(1)当总体很大或不便获得时,可以用样本的频率分布去估计总体的频率分布,我们把反映样本频率分布的表格称为频率分布表.绘制频率分布表的步骤为:①求极差;②决定组距和组数;③将数据分组;④列频率分布表.

(2)利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图.画频率分布直方图的一般步骤是:①绘制频率分布表;②作直角坐标系,把横轴分成若干段,每一段对应一个组的组距;③在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它

的高等于该组的

频率组距

.此时,每个矩形的面积恰好就是该组的频率,显然所有矩形的面积之和为1. 3.样本的数字特征

(1)众数

在样本数据中,出现次数最多的那个数据.

(2)中位数

样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数

样本数据的算术平均数,即x =1n

(x 1+x 2+…+x n ). (4)方差与标准差

方差:s 2=1n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 标准差:s = 1n x 1-x 2+x 2-x 2+…+x n -x 2].

【助学·微博】

一条规律 三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n ,总体的个体数为N ,则用这三种方法抽样时,每个个体被抽到的概率都是n N .

两个特性

(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样本容量,各小组频率的和等于1;

(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于该组的频率,所有小矩形的面积之和为1.

考点自测

1.(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ).

A .7

B .9

C .10

D .15

解析 从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n 组抽到的号码为a n =9+30(n -1)=30n -21,由

451≤30n -21≤750,得23615≤n ≤25710

,所以n =16,17,…,25,共有25-16+1=10人,选C.

答案 C

2.(2013·临沂模拟)甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生.为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三校分别抽取的学生人数是( ).

A .30,30,30

B .30,45,15

C .20,30,10

D .30,50,10

解析 抽取比例是903 600+5 400+1 800=1120,故三校分别抽取的学生人数为3 600×1120

=30,5 400×1120=45,1 800×1120

=15. 答案 B

3.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是( ).

A .14

B .16

C .15

D .17

解析 将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为15+152

=15.

答案 C

4.(2013·西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据落在[6,10)内的频数为( ).

A .12

B .48

C .60

D .80

解析 落在[6,10)内的频率为0.08×4=0.32,故频数为0.32×150=48.

答案 B

5.(2013·长沙模拟)

如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.

(注:方差s 2=1n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)

解析 x =15(8+9+10+13+15)=11,s 2=15

×(9+4+1+4+16)=6.8. 答案 6.8

考向一 抽样方法

【例1】?从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.

[审题视点] 因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.

解 由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:

第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);

第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k =80080

=10个个体;

第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如

5)作为起始编号;

第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.

解决系统抽样问题的两个关键步骤为:

(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.

(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.

【训练1】 (2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.

解析 根据分层抽样的特点求解.从小学中抽取30×150150+75+25

=18所学校;从中学中抽取30×75150+75+25=9所学校.

答案 18 9

考向二 频率分布直方图的绘制及应用

【例2】?某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:

续表

(1)补全频率分布直方图; (2)求n ,a ,p 的值.

[审题视点] (1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:频率组距×组距=频率,频数样本容量

=频率求解.

解 (1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为0.3

5

=0.06.频率分布直方图如图所示.

(2)第一组的人数为1200.6

=200,频率为0.04×5=0.2, 所以n =2000.2

=1 000. 由(1)知,第二组的频率为0.3,所以第二组的人数为1 000×0.3=300,所以p =195300

=0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为 1 000×0.15=150,所以a =150×0.4=60.

(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率

之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是频率组距

,而不是频率. (2)由频率分布直方图进行相关计算时,需掌握下列关系式:频率组距

×组距=频率. 【训练2】 (2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0 m(精确到0.1 m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.

(1)求这次铅球测试成绩合格的人数;

(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由.

解 (1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14,

∴此次测试的总人数为70.14

=50. ∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.

(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,

∴中位数位于第4组内.

考向三 用样本的数字特征估计总体的数字特征

【例3】?甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.

(1)分别求出两人得分的平均数与方差;

(2)根据图和上面算得的结果,对两人的训练成绩作出评价.

[审题视点] (1)先通过图象统计出甲、乙二人的成绩;

(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.

解 (1)由图象可得甲、乙两人五次测试的成绩分别为

甲:10分,13分,12分,14分,16分;

乙:13分,14分,12分,12分,14分. x 甲=

10+13+12+14+165=13, x 乙=

13+14+12+12+145=13, s 2甲=15

[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2

乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.

(2)由s 2甲>s 2

乙可知乙的成绩较稳定.

从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.

(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.

(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.

【训练3】

(2012·陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统

计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( ).

A.x 甲m 乙

B.x 甲

C.x 甲>x 乙,m 甲>m 乙

D.x 甲>x 乙,m 甲

解析 x 甲=

116

(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516, x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716. ∴x 甲

又∵m 甲=20,m 乙=29,∴m 甲

答案 B

方法优化15——快速掌握抽样方法的技巧

【命题研究】 通过近三年的高考试题分析,考查分层抽样方法的题目较多,其次是系统抽样.题型多为选择题、填空题,有的与统计的其它知识或概率综合考查,常以解答题的形式出现,难度较低.

【真题探究】? (2012·江苏)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.

[教你审题] 一审 等比例性质;

二审 抽取的样本容量.

[优美解法] 高二年级学生人数占总数的

33+3+4=310.样本容量为50,则高二年级抽取:50×310

=15(名)学生. [答案] 15

[反思] 用分层抽样抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于样本容量在总体中的比例,即n N .

【试一试】 (2013·徐州模拟)从某小学随机抽取100名同学,这些同学身高都不低于100

厘米,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).现用分层抽样的方法从身高在[120,130),[130,140),[140,150]三组学生中,选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.

解析 由(0.005+0.010+0.020+0.035+a )×10=1,得a =0.030,因此[120,130),[130,140),[140,150]三组学生人数分别为:0.3×100=30,0.20×100=20,0.10×100=10,所以,从身高在[140,150]内的学生中选取的人数应为10

30+20+10

×18=3.

答案 3

A 级 基础演练(时间:30分钟 满分:55分)

一、选择题(每小题5分,共20分)

1.(2013·西安质检)对某商店一个月内每天的顾客人数进行了统计, 得到样

本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是

( ). A .46,45,56 B .46,45,53 C .47,45,56

D .45,47,53

解析 样本共30个,中位数为45+472=46;显然样本数据出现次数最多的为

45,故众数为45;极差为68-12=56,故选A. 答案 A

2.(2013·南昌模拟)小波一星期的总开支分布如图(a)所示,一星期的食品开支如图(b)所示,则小波一星期的鸡蛋开支占总开支的百分比为

( ).

A .30%

B .10%

C .3%

D .不能确定

解析 由题图(b)可知小波一星期的食品开支共计300元,其中鸡蛋开支30元.又由题图(a)知,一周的食品开支占总开支的30%,则可知一周总开支为

1 000元,所以鸡蛋开支占总开支的百分比为301 000

×100%=3%. 答案 C

3.(2013·成都模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( ).

A .101

B .808

C .1 212

D .2 012

解析 甲社区驾驶员的抽样比例为1296=18

,四个社区驾驶员总人数的抽样比例为12+21+25+43N =101N ,由101N =18

,得N =808. 答案 B

4.(2012·安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则 ( ).

A .甲的成绩的平均数小于乙的成绩的平均数

B .甲的成绩的中位数等于乙的成绩的中位数

C .甲的成绩的方差小于乙的成绩的方差

D .甲的成绩的极差小于乙的成绩的极差

解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15

×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125

,C 对;甲、乙的成绩的极差均为4,D 错. 答案 C

二、填空题(每小题5分,共10分)

5.(2013·武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.

解析 设第1组抽取的号码为b ,则第n 组抽取的号码为8(n -1)+b ,∴8×(16-1)+b =126,∴b =6,故第1组抽取的号码为6.

答案 6

6.(2013·苏州一中月考)某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.

解析 低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800.

答案 800

三、解答题(共25分)

7.(12分)某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.

解 用分层抽样方法抽取.

具体实施抽取如下:

(1)∵20∶100=1∶5,∴105=2,705=14,205

=4, ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.

(2)因副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数表法抽取14人.

(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.

8.(13分)(2012·揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:

(1)求分数在[50,60]的频率及全班人数;

(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08.

由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08

=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩

形的高为425

÷10=0.016. B 级 能力突破

(时间:30分钟 满分:45分)

一、选择题(每小题5分,共10分)

1.(2013·哈尔滨模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是

( ). A .13,12 B .13,13 C .12,13

D .13,14

解析 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=(a 3)2

=64,(8-2d )(8+4d )=64,(4-d )(2+d )=8,2d -d 2

=0,又d ≠0,故d =2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为+10

=13,中位数为12+14

2

=13,

故选B. 答案 B

2.(2012·江西)样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =αx +(1-α)y ,其中0<α<1

2,则n ,m 的大小关系为

( ). A .n m C .n =m

D .不能确定

解析 依题意得x 1+x 2+…+x n =n x ,y 1+y 2+…+y m =m y ,

x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z =(m +n )αx +(m +n )(1-α)y ,

∴n x +m y =(m +n )αx +(m +n )(1-α)y ,

∴?

????

n =m +n α,m =m +n

-α

于是有n -m =(m +n )[α-(1-α)]=(m +n )(2α-1), ∵0<α<1

2,∴2α-1<0,∴n -m <0,即m >n .

答案 A

二、填空题(每小题5分,共10分)

3.(2013·沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n 的样本,其中高三学生有11人,则n 的值等于________.

解析 由n 600+500+550=11550

,得n =33(人). 答案 33

4.(2013·北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是__________________________________________________________________.

解析 成绩在[16,18]的学生的人数所占比例为

6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920

=54. 答案 54

三、解答题(共25分)

5.(12分)汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO 2排放量超过130 g/km 的MI 型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI 型品牌的新车各抽取了5辆进行CO 2排放量检测,记录如下(单位:g/km):

经测算发现,乙类品牌车CO 2排放量的均值为x 乙=120 g/km.

(1)求甲类品牌汽车的排放量的平均值及方差;

(2)若乙类品牌汽车比甲类品牌汽车CO 2的排放量稳定性好,求x 的取值范围.

解 (1)甲类品牌汽车的CO 2排放量的平均值x 甲=80+110+120+140+1505

=120(g/km), 甲类品牌汽车的CO 2排放量的方差

s 2甲=

-2+-2+-2+-2+-25 =600.

(2)由题意知乙类品牌汽车的CO2排放量的平均值x乙=100+120+x+y+160

5

120(g/km),得x+y=220,故y=220-x,所以乙类品牌汽车的CO2排放量的方差

s2乙=-2+-2+x-2+-x-2+-2

5

因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s2乙

职工,将全体职工随机按1~50编号,并按编号顺序

平均分成10组,按各组内抽取的编号依次增加5进行

系统抽样.

(1)若第5组抽出的号码为22,写出所有被抽出职工

(2)的号码;

(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求

该样本的方差;

(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的

职工,求体重为76公斤的职工被抽取到的概率.

解(1)由题意,第5组抽出的号码为22.

因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.

(2)因为10名职工的平均体重为

x=

1

10

(81+70+73+76+78+79+62+65+67+59)=71,

所以样本方差为:s2=1

10

(102+12+22+52+72+82+92+62+42+122)=52.

(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).

记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.

故所求概率为P(A)=4

10=

2

5

.

本文来源:https://www.bwwdw.com/article/422e.html

Top