必修3第二章 统计 教案

更新时间:2023-05-08 14:50:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

新课标高中数学人教版(A) 必修③第二章统计王新敞

第二章统计

统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据。在客观世界中,需要认识的现象无穷无尽。要认识某现象的第一步就是通过观察或试验取得观测资料,然后通过分析这些资料来认识此现象。如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问题。

现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学——统计学就备受重视。“课标”中指出统计与概率的基础知识已经成为一个未来公民的必备常识。从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学要求随着学段的升高逐渐提高。在义务教育阶段的统计与概率知识的基础上,“课标”要求教科书通过实际问题及情景,进一步介绍随机抽样、样本估计总体、线性回归的基本方法。

本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。全章共安排了3个小节,教学约需16课时,具体内容和课时分配(仅供参考)如下:

2.1 随机抽样约5课时

2.2 用样本估计总体约5课时

2.3变量间的相关关系约4课时

实习作业约1课时

小结约1课时

一、教科书内容与课程学习目标

通过实际问题情境,学习随机抽样、用样本估计总体、线性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异。

本章知识展开的结构框图如下:

现代社会是信息化的社会,人们面临形形色色的问题,把问题用数量化的形式表示,是利用数学工具解决问题的基础。对于数量化表示的问题,需要收集数据、分析数据、解答问题。统计学是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。

奎屯市第一高级中学第1页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

在义务教育阶段已经介绍了一些有关抽样调查的知识,本章的侧重点在于如何能够得到高质量的样本,了解方便样本的缺点以及随机样本的简单性质。教科书首先通过大量的日常生活中的统计数据,通过边框的问题和探究栏目引导学生思考用样本估计总体的必要性,以及样本的代表性问题。为强化样本代表性的重要性,教科书通过一个著名的预测结果出错的案例,使学生体会抽样不是简单的从总体中取出几个个体的问题,它关系到最后的统计分析结果是否可靠。关于这个案例,还隐含着方便样本代表性差的问题,教师稍加引导就可以使学生体会到这一点。通过对“广告中数据的可靠性”的思考,使学生能从样本代表性的角度思考日常生活中的数字统计结果的科学性问题。

在学生体会到样本的重要性之后,接下来教科书以袋装牛奶的质量问题为情景,探讨获取能够代表总体样本的方法。在这个过程中,教科书利用一勺汤来“判断一锅汤的味道”的浅显道理,使学生认识到把总体“搅拌均匀”是取得有代表性总体的关键所在。教师稍加引导,就可使学生体会到“搅拌均匀”的本质是使总体中的每个个体入选到样本的可能性相等,这样就自然地得到了随机样本的概念。随后教科书较详细地介绍了简单随机抽样方法,通过实际问题情景引入系统抽样和分层抽样方法。最后通过探究的方式,引导学生总结三种随机抽样方法的优缺点。

当研究的对象为人时,获取样本数据变得更加复杂,涉及到组织问题、心理学问题、道德问题等,教科书通过阅读与思考“如何得到敏感性问题的诚实反应”,让学生体会到这一点。

在第2节,教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿本节始终。通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图。这里教科书按照《标准》的要求,主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间。教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想。

由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征。

教科书还结合实例展示了频率分布的众数、中位数和平均数。对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导。另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同。在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论。进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点。这样处理,可以给教师留下较大发挥空间,根据学生的不同情况,采取不同的处理方法。

教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征。通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程。教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用。

变量之间的关系,是人们感兴趣的问题。教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系。在教师的引导下,可使学生认识到在现实世界

奎屯市第一高级中学第2页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性。随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型)。教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想。通过气温与饮料销售量的例子及随后的思考,使同学了解利用线性回归方程解决实际问题的全过程,体会线性回归方程做出的预测结果的随机性,并且可能犯的错误。进一步,教师可以利用计算模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性。

在阅读与思考“相关关系的强与弱”中,进一步介绍了描述两个变量之间关系强弱的样本特征——相关系数的计算公式及统计含义,通过分析具有不同相关系数的数据的散点图,进一步加深学生对相关系数的直观理解。

二、考虑的几个主要问题

1.强调典型案例的作用

统计与现实生活的联系是非常紧密的,这一领域的内容对学生来说应该是充满趣味性和吸引力的。在教科书编写时,我们特别注意了选择典型的、学生感兴趣的问题作为例子,让学生体会其中的统计原理。例如,教科书中通过1936年美国总统选举前的一次失败的民意调查,让学生体会方便样本所带来的问题,理解为什么要采用随机样本。

在编写教科书时,还注意用类比的方法,使学生更加深刻地理解统计方法的精髓。例如在引出简单随机样本之前,用如何品尝一锅汤的味道来类比。

这种利用典型案例编写统计内容的方式,可以使学生在解决实际问题的过程中,经历数据处理的全过程,并在这个数据处理的过程中学习有关的统计知识和方法,体会统计的思想,同时也使学生感受统计与实际生活的联系以及在解决现实问题中的作用。

2.注意从案例中发现规律,培养学生从具体到抽象的思维能力

教科书各节的开头,都借助于一个具体问题情景的探究或思考,引导学生从具体的问题中总结、抽象出一般规律,使学生体会其中的统计思想来源,培养创造性思维的能力。

3.通过开放性问题给学生留下宽广的探索空间,给教师留下更多的发挥余地

教科书中设置了思考、探究等栏目和阅读与思考等选学内容,还在边框中提出了一些关键性的问题;其中的一些问题并没有在教科书中给出明确的答案,而在教师教学用书中说明了设置这些问题的目的、解答问题所需的知识点和需要注意的事项,以及参考答案。这样的安排,是为了锻炼学生的创造性思维能力,同时为教师的教学留下更多的余地。

4.注意与初中相关内容的衔接,为后续学习打下基础

教科书编写时,一方面注意与初中以前学习的相关内容的衔接,同时也注意为后续学习打好基础。比如在介绍众数、中位数和平均数时,介绍了利用频率分布图来估计这些特征的另一种途径,并通过思考栏目使学生发现这里的方法与初中学过的方法之间的联系,进一步加深对这些概念的理解。

5. 注重对统计推断结论的正确理解

教科书通过边框和思考栏目等引导学生正确理解实际问题中的统计推断结论。

6. 对现代教育技术的应用说明

计算机多媒体及仿真技术,能够很好地帮助学生理解随机现象,处理数据和画统计图。因为教科书是直接面向学生的书面材料,不同的软件操作方法也不同,所以我们没有在教科书的各处都详细介绍利用现代信息技术进行教学的方法,而是把它放到教师教学用书中,并且配备相应的光盘,以利于教师根据不同的情况,更好地展示自己的教学特色。

奎屯市第一高级中学第3页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

2.1.1简单随机抽样

教学目标:

1、知识与技能:

(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;

2、过程与方法:

(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;

(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。

3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知

识与现实世界及各学科知识之间的联系,认识数学的重要性。

4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并

能灵活应用相关知识从总体中抽取样本。

教学设想:

假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?

显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢?

【探究新知】

一、简单随机抽样的概念

一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。

【说明】简单随机抽样必须具备下列特点:

(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。

(2)简单随机样本数n小于等于样本总体的个数N。

(3)简单随机样本是从总体中逐个抽取的。

(4)简单随机抽样是一种不放回的抽样。

(5)简单随机抽样的每个个体入样的可能性均为n/N。

思考?

下列抽样的方式是否属于简单随机抽样?为什么?

(1)从无限多个个体中抽取50个个体作为样本。

(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。

二、抽签法和随机数法

1、抽签法的定义。

一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

【说明】抽签法的一般步骤:

(1)将总体的个体编号。

(2)连续抽签获取样本号码。

思考?

你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?

2、随机数法的定义:

利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。

奎屯市第一高级中学第4页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。

第一步,先将800袋牛奶编号,可以编为000,001, (799)

第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。

16 22 77 94 39 49 54 43 54 82 17 37 93 23 78

84 42 17 53 31 57 24 55 06 88 77 04 74 47 67

63 01 63 78 59 16 95 55 67 19 98 10 50 71 75

33 21 12 34 29 78 64 56 07 82 52 42 07 44 38

57 60 86 32 44 09 47 27 96 54 49 17 46 09 62

87 35 20 96 43 84 26 34 91 64

21 76 33 50 25 83 92 12 06 76

12 86 73 58 07 44 39 52 38 79

15 51 00 13 42 99 66 02 79 54

90 52 84 77 27 08 02 73 43 28

第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。

【说明】随机数表法的步骤:

(1)将总体的个体编号。

(2)在随机数表中选择开始数字。

(3)读数获取样本号码。

【例题精析】

例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?

[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。

例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?

[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法。

解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。

解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。

【课堂练习】P57 1-4

【课堂小结】

1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法。

2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方奎屯市第一高级中学第5页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。

3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。

【评价设计】

1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是

A.总体是240 B、个体是每一个学生

C、样本是40名学生

D、样本容量是40

2、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()

A、总体

B、个体是每一个学生

C、总体的一个样本

D、样本容量

3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。

4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。

奎屯市第一高级中学第6页(共26页)

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第7页 (共26页) 2.1.2 系统抽样

教学目标:

1、知识与技能:

(1)正确理解系统抽样的概念;

(2)掌握系统抽样的一般步骤;

(3)正确理解系统抽样与简单随机抽样的关系;

2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,

3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系。

4、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。 教学设想:

【创设情境】某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?

【探究新知】

一、系统抽样的定义:

一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

【说明】由系统抽样的定义可知系统抽样有以下特证:

(1)当总体容量N 较大时,采用系统抽样。

(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k =[n N

].

(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。

思考?(1)你能举几个系统抽样的例子吗?

(2)下列抽样中不是系统抽样的是 ( )

A 、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到

大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样

B 工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验

C 、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止

D 、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈

点拨:(2)c 不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。

二、系统抽样的一般步骤。

(1)采用随机抽样的方法将总体中的N 个个编号。

(2)将整体按编号进行分段,确定分段间隔k(k ∈N,L ≤k).

(3)在第一段用简单随机抽样确定起始个体的编号L (L ∈N,L ≤k )。

(4)按照一定的规则抽取样本,通常是将起始编号L 加上间隔k 得到第2个个体编号L+K ,再加上K 得到第3个个体编号L+2K ,这样继续下去,直到获取整个样本。

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第8页 (共26页) 【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从

而把复杂问题简单化,体现了数学转化思想。

【例题精析】

例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学

习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。

[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。

解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59

组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依

次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学

生中抽出一名学生,不妨设编号为k(1≤k ≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,

58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。

例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发

射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能

A .5,10,15,20,25

B 、3,13,23,33,43

C .1,2,3,4,5

D 、2,4,6,16,32

[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中

d=50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求,故选B 。

【课堂练习】P59 练习1. 2. 3

【课堂小结】

1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步

骤为:

(1)采用随机的方法将总体中个体编号;

(2)将整体编号进行分段,确定分段间隔k(k ∈N);

(3)在第一段内采用简单随机抽样的方法确定起始个体编号L ;

(4)按照事先预定的规则抽取样本。

2、在确定分段间隔k 时应注意:分段间隔k 为整数,当N

不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k 。

【评价设计】

1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为

A .99

B 、99,5

C .100

D 、100,5

2、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样

的方法,则所选5名学生的学号可能是 ( )

A .1,2,3,4,5

B 、5,16,27,38,49

C .2, 4, 6, 8, 10

D 、4,13,22,31,40

3、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人

样的可能性为 ( )

A .8 B.8,3 C .8.5 D.9

4、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为

了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。

5、某单位的在岗工作为624人,为了调查工作上班时,从家到单位的路上平均所用的时间,

决定抽取10%的工作调查这一情况,如何采用系统抽样的方法完成这一抽样?

新课标高中数学人教版(A) 必修③第二章统计王新敞

2.1.3 分层抽样

教学目标:

1、知识与技能:

(1)正确理解分层抽样的概念;

(2)掌握分层抽样的一般步骤;

(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。

2、过程与方法:通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实

际问题的方法。

3、情感态度与价值观:通过对统计学知识的研究,感知数学知识中“估计

与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。

4、重点与难点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选

择三种抽样方法解决现实生活中的抽样问题。

教学设想:

【创设情景】

假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的

小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?

【探究新知】

一、分层抽样的定义。

一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。

【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:

(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。

(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。

二、分层抽样的步骤:

(1)分层:按某种特征将总体分成若干部分。

(2)按比例确定每层抽取个体的个数。

(3)各层分别按简单随机抽样的方法抽取。

(4)综合每层抽样,组成样本。

【说明】

(1)分层需遵循不重复、不遗漏的原则。

(2)抽取比例由每层个体占总体的比例确定。

(3)各层抽样按简单随机抽样进行。

探究交流

(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()

A、每层等可能抽样

B、每层不等可能抽样

C、所有层按同一抽样比等可能抽样

(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n

样本,那么每个个体被抽到的可能性为()

奎屯市第一高级中学第9页(共26页)

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第10页 (共26页)

A .N 1

B.n 1

C.N n

D.N n

点拨:

(1)保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽

共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C 。

(2)根据每个个体都等可能入样,所以其可能性本容量与总体容量

比,故此题选C 。

知识点2 简单随机抽样、系统抽样、分层抽样的比较

【例选精析】

例1、 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现

采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为

A.15,5,25

B.15,15,15

C.10,5,30 D15,10,20

[分析]因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各

抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D 。

例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人

中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。 [分析]采用分层抽样的方法。

解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:

(1)将3万人分为5层,其中一个乡镇为一层。

(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。 300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。 (3)将300人组到一起,即得到一个样本。 【课堂练习】P62 练习1. 2. 3

新课标高中数学人教版(A) 必修③第二章统计王新敞

【课堂小结】

1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:

(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。

(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。

(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。

2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。

【评论设计】

1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()

A.简单随机抽样

B.系统抽样

C.分层抽样

D.先从老人中剔除1人,然后再分层抽样

2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为人。

3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n= 。

4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:

试利用上述资料设计一个抽样比为1/10的抽样方法。

P62 A 5 B 1

奎屯市第一高级中学第11页(共26页)

新课标高中数学人教版(A) 必修③第二章统计王新敞

2.2.1用样本的频率分布估计总体分布(第1课时)

教学目标:

知识与技能

(1)通过实例体会分布的意义和作用。

(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。

(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。

过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。

情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

重点与难点

重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。

难点:能通过样本的频率分布估计总体的分布。

教学设想

【创设情境】

在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕

甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50

乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33

请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?

如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。

【探究新知】

〖探究〗:P55

我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)

为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(如课本P56)分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。

下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。

〈一〉频率分布的概念:

频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:

(1)计算一组数据中最大值与最小值的差,即求极差

(2)决定组距与组数

奎屯市第一高级中学第12页(共26页)

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第13页 (共26页)

(3) 将数据分组 (4) 列频率分布表 (5) 画频率分布直方图

以课本P 56制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学生自己动手作图)

频率分布直方图的特征:

从频率分布直方图可以清楚的看出数据分布的总体趋势。 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

〖探究〗同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图不同的看法进行交流……) 接下来请同学们思考下面这个问题:

〖思考〗如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见课本P 57)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)

〈二〉频率分布折线图、总体密度曲线

1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本P 60) 〖思考〗

1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?

2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么? 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确. 【例题精析】

〖例1〗下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)

(1)(2)一画出频率分布直方图;

(3)估计身高小于134cm的人数占总人数的百分比.。 分析:根据样本频率分布表、频率分布直方图的一般步骤解题。 解:(1)样本频率分布表如右:

(2)其频率分布直方图如下:

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第14页 (共26页) (3)由样本频率分布表可知身高小于134cm

的男孩出现的频率为0.04+0.07+0.08=0.19,

所以我们估计身高小于134cm 的人数占总人数的19%. 〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳

次数次测试,将所得数据整理后,画出

频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:

9:3,第二小组频数为12.

(1) 第二小组的频率是多少?样本容量是多少?

(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?

(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。

分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。

解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593

=+++++ 又因为频率=第二小组频数样本容量,所以 121500.08

===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为

171593100%88%24171593+++?=+++++ (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,

前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。

【课堂精练】

P 71 练习 1. 2. 3

【课堂小结】

总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。

总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。

【评价设计】

1.P 81 习题2.2 A 组 1、 2

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第15页 (共26页) §2.2.1用样本的频率分布估计总体分布 第二课时 茎叶图

教学目标

(1)掌握茎叶图的意义及画法,并能在实际问题中用茎叶图用数据统计;

(2)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.

教学重点 茎叶图的意义及画法.

教学难点

茎叶图用数据统计. 教学过程 一、复习练习:

为了了解高一学生的体能情况,某校抽取部

分学生进行一分钟跳绳次数次测试,将所得数据

整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12. (1) 第二小组的频率是多少?样本容量是多

少?

(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多

少?

(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。

分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。

解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593

=+++++ 又因为频率=第二小组频数样本容量,所以 121500.08

===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为

171593100%88%24171593

+++?=+++++ (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组.

二、问题情境

1.情境:某篮球运动员在某赛季各场比赛的得分情况如下:

12,15,24,25,31,31,36,36,37,39,44,49,50.

2.问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?

三、建构数学

1.茎叶图的概念:

一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个

有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P 70例子)茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。

2.茎叶图的特征:

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第16页 (共26页

)

(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有

数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;

(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易

操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;

(3)茎叶图对重复出现的数据要重复记录,不能遗漏. 四、数学运用 1.例题: 例1.(1)情境中的运动员得分的茎叶图如图:

(2)从这个图可以直观的看出该运动员平均得分及中位数、众数都在20和40之间,且分布较对称,集中程度高,说明其发挥比较稳定.

例2.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.

甲 12,15,24,25,31,31,36,36,37,39,44,49,50. 乙 8,13,14,16,23,26,28,33,38,39,51

解:画出两人得分的茎叶图

从这个茎叶图可以看出甲运动员的得分大致对称平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好. 2.练习:

(1) 右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知 ( A ) A .甲运动员的成绩好于乙运动员 B .乙运动员的成绩好于甲运动员

C .甲、乙两名运动员的成绩没有明显的差异

D .甲运动员的最低得分为0分 (2)课本第71页,练习第3题.

五、回顾小结:

1.绘制茎叶图的一般方法; 2.茎叶图的特征. 六、课外作业: 课本第81页第1题.

0 1 2 3 4 5

乙 8 247 199 36 2

50 32 875421

944

1

新课标高中数学人教版(A) 必修③第二章统计王新敞

2.2.2用样本的数字特征估计总体的数字特征(2课时)

教学目标:

知识与技能

(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。

(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。

(3)会用样本的基本数字特征估计总体的基本数字特征。

(4)形成对数据处理过程进行初步评价的意识。

过程与方法

在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。

情感态度与价值观

会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。

重点与难点

重点:用样本平均数和标准差估计总体的平均数与标准差。

难点:能应用相关知识解决简单的实际问题。

教学设想

【创设情境】

在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕

甲运动员﹕7,8,6,8,6,5,8,10,7,4;

乙运动员﹕9,5,7,8,7,6,8,6,7,7.

观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。

【探究新知】

<一>、众数、中位数、平均数

〖探究〗:P72

(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?

(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)

初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。

〖提问〗:请大家翻回到课本第56页看看原来抽样的数据,有没有2.25这个数值呢?

根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。

〖提问〗:那么如何从频率分布直方图中估计中位数呢?

分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即

中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为奎屯市第一高级中学第17页(共26页)

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第18页 (共26页) 2.02。(图略见课本63页图2.2-6)

〖思考〗:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中

的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)

(课本73页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少

数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。 〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)

<二>、标准差、方差

1.标准差

平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。

例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4;

乙运动员﹕9,5,7,8,7,6,8,6,7,7.

观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲, 。

两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P74图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。

考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s 表示。

样本数据1,2,,n x x x 的标准差的算法:

(1) 算出样本数据的平均数x 。

(2) 算出每个样本数据与样本数据平均数的差:(1,2,)i x x i n -=

(3) 算出(2)中(1,2,)i x x i n -= 的平方。

(4) 算出(3)中n 个平方数的平均数,即为样本方差。

(5) 算出(4)中平均数的算术平方根,,即为样本标准差。

其计算公式为:s =显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。

〖提问〗标准差的取值范围是什么?标准差为0的样本数据有什么特点?

从标准差的定义和计算公式都可以得出:0s ≥。当0s =时,意味着所有的样本数据都等于样本平均数。(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。)

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第19页 (共26页) 2.方差

从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:2222121[()()()]n s x x x x x x n

=-+-++- 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。

【例题精析】

〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。

(1)5,5,5,5,5,5,5,5,5

(2)4,4,4,5,5,5,6,6,6

(3)3,3,4,4,5,6,6,7,7

(4)2,2,2,2,5,8,8,8,8

分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。

解:(图略,可查阅课本P76)

四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。 他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。 〖例2〗:(见课本P77)

分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的

平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。

【课堂精练】

P 79 练习 1. 2. 3

【课堂小结】

1. 用样本的数字特征估计总体的数字特征分两类:

a) 用样本平均数估计总体平均数。

b) 用样本标准差估计总体标准差。样本容量越大,估计就越精确。

2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平。

3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。

【评价设计】

1.P 81 习题2.2 A 组 4、 5、6、7

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第20页 (共26页

) 2.3.1变量间的相关关系

2.3.2两个变量的线性相关

教学目标

(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;

(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回 归方程进行预测;

(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.

教学重点

散点图的画法,回归直线方程的求解方法.

教学难点

回归直线方程的求解方法.

教学过程

一、问题情境

1.情境:

客观事物是相互联系的 过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系 学是“因”,物理是“果”,或者反过来说 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系 但还存在着另一种非确定性关系——相关关系

2.问题:

某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的

如果某天的气温是5-C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?

二、学生活动

为了了解热茶销量与气温的大致关系,我们以横坐标x 表示气温,纵坐标y 表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内

标出,得到下图,今后我们称这样的图为散点图(scatterplot).

从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数

近似地表示热茶销量与气温之间的关系.

选择怎样的直线近似地表示热茶销量与气温之间的关系?

我们有多种思考方案:

(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直

线;

(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;

(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平

均值,作为所求直线的斜率、截距;

………………

怎样的直线最好呢?

三、建构数学

1.最小平方法:

用方程为?y

bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线?y

bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个?y

的值: 26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应

新课标 高中数学 人教版(A) 必修③ 第二章 统计 王新敞

奎屯市第一高级中学 第21页 (共26页) 该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和

22222222(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172

Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-+

+-+-+-=++--+

(,)Q a b 是直线?y

bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线?y

bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) .

先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286

a b -=-

?时, Q 取得最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012b a -=-时, Q 取得最小值.因此,当140382021286140460

12a b b a -?=-????-?=-??时,Q 取的最小值,由此解得

1.6477,57.5568b a ≈-≈.所求直线方程为? 1.647757.5568y

x =-+.当5x =-时,?66y

≈,故当气温为5-0C 时,热茶销量约为66杯. 2.线性相关关系:

像能用直线方程?y

bx a =+近似表示的相关关系叫做线性相关关系. 3.线性回归方程:

当,a b 使1122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称?y

bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线. 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即

11122

11()()()n n n i i i i i i i n n i i i i n x y x y b n x x a y bx =====?-?=??-??=-??∑∑∑∑∑,(*) ∑==n i i x n x 1

1, ∑==n i i y n y 11 四、数学运用

1.例题:

例1. 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.

相关关系.计算相应的数据之和:

8888

211111031,71.6,137835,9611.7i i i i i i i i i x

y x x y ========∑∑∑∑, 将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,

本文来源:https://www.bwwdw.com/article/3nve.html

Top