2019最新高中数学 第3章 统计案例 3.2 回归分析教学案 苏教版选

更新时间:2024-05-27 14:36:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

初高中精品文档

3.2 回归分析

1.线性回归模型 (1)随机误差

具有线性相关关系的两个变量的取值x、y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.

(2)随机误差产生的主要原因

①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.

(3)线性回归模型中a,b值的求法 y=a+bx+ε称为线性回归模型. a,b的估计值为a ∧,b ∧,则

--

∑xy-nxy??b ∧=

∑x-n(x) ???a ∧=y-b ∧ -xi=1nii2

2

ni=1i(4)回归直线和线性回归方程

直线y_∧=a_∧+b_∧x称为回归直线,此直线方程即为线性回归方程,a ∧称为回归截距,b ∧称为回归系数,y ∧称为回归值.

2.样本相关系数r及其性质

--

∑xiyi-nxyi=1n22n(1)r=n22.

(∑xi-n(x))(∑yi-n(y))i=1i=1(2)r具有以下性质

①|r|≤1.

②|r|越接近于1,x,y的线性相关程度越强. ③|r|越接近于0,x,y的线性相关程度越弱. 3.对相关系数r进行显著性检验的基本步骤

(1)提出统计假设H0:变量x,y不具有线性相关关系.

(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平).

(3)计算样本相关系数r.

欢迎使用下载!

初高中精品文档

(4)作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.

1.在线性回归方程中,b既表示回归直线的斜率,又表示自变量x的取值增加一个单位时,函数值y的改变量.

2.通过回归方程y ∧=a ∧+b ∧x可求出相应变量的估计值.

3.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.

[例1] 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:

x y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 若由数据可知,y对x呈现线性相关关系. (1)求线性回归方程;

(2)估计使用年限为10年时,维修费用是多少?

[思路点拨] 代入数值求线性回归方程,然后把x=10代入,估计维修费用. [精解详析] (1)列表如下:

i 1 2 3 4 5 xi 2 3 4 5 6 yi 2.2 3.8 5.5 6.5 7.0 xiyi 4.4 11.4 22.0 32.5 42.0 x24 9 16 25 36 i 2经计算得:x=4,y=5,∑5,i=1xi=90,∑5,i=1xiyi=112.3,

a ∧=y-b ∧·x=0.08,

所以线性回归方程为y ∧=a ∧+b ∧x=0.08+1.23x. (2)当x=10时,y ∧=0.08+1.23×10=12.38(万元),

欢迎使用下载!

初高中精品文档

即若估计使用年限为10年时,维修费用为12.38万元. [一点通] 线性回归分析的步骤:

(1)列出散点图,从直观上分析数据间是否存在线性相关关系;

22

(2)计算x,y,∑n,i=1xi,∑n,i=1yi,∑n,i=1xiyi;

(3)代入公式求出y ∧=b ∧x+a ∧中参数b ∧,a ∧的值; (4)写出线性回归方程,并对实际问题作出估计.

1. 某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:

x y 6 2 8 3 10 5 12 6

则y对x的线性回归方程为_________________________________________________. -6+8+10+12-2+3+5+6

解析:∵x==9,y==4,

44

故y对x的线性回归方程为y ∧=0.7x-2.3.

答案:y ∧=0.7x-2.3

2.某班5名学生的数学和物理成绩如表:

学生学科 数学成绩(x) 物理成绩(y) A 88 78 B 76 65 C 73 71 D 66 64 E 63 61 (1)画出散点图;

(2)求物理成绩y对数学成绩x的线性回归方程;

(3)一名学生的数学成绩是96,试预测他的物理成绩. 解:(1)散点图如图.

1

(2)∵x=× (88+76+73+66+63)=73.2.

5

y=×(78+65+71+64+61)=67.8.

5

15

i=1

∑xiyi=88×78+76×65+73×71+66×64+63×61=25 054.

欢迎使用下载!

初高中精品文档

5

又∑xi=88+76+73+66+63=27 174. i=1

222222

∴y对x的线性回归方程是y ∧=0.625x+22.05. (3)当x=96时,y ∧=0.625×96+22.05≈82. 可以预测他的物理成绩是82.

[例2] 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:

学生号 1 120 84 2 108 64 3 117 84 4 104 68 5 103 69 6 110 68 7 104 69 8 105 46 9 99 57 10 108 71 x y 请问:这10名学生的两次数学成绩是否具有线性关系? [思路点拨] 可先计算线性相关系数r的值,然后与r0.05比较,进而对x与y的相关性作出判断.

[精解详析] x==68.

11

(120+108+…+99+108)=107.8,y=(84+64+…+57+71)1010

所以相关系数为

73 796-10×107.8×68

r= 22

(116 584-10×107.8)(47 384-10×68)≈0.751.

由检验水平0.05及n-2=8, 在附录2中查得r0.05=0.632, 因为0.751>0.632,

由此可看出这10名学生的两次数学成绩具有较强的线性相关关系. [一点通] 利用相关系数r进行判断相关关系,需要应用公式计算出r的值,由于数据

欢迎使用下载!

初高中精品文档

较大,需要借助计算器,但计算时应该特别细心,避免出现计算错误.

3.对于回归分析,有下列叙述: (1)在回归分析中,变量间的关系若是非确定性关系,则因变量不能自由变量惟一确定. (2)线性相关系数可以是正的或是负的.

2

(3)回归分析中,如果r=1或r=±1,说明x与y之间完全线性相关. (4)样本相关系数r∈(-∞,+∞). 判断其说法是否正确. 解:由回归模型及其性质易知(1),(2),(3)是正确的.相关系数的取值范围应为|r|≤1,所以(4)是错误的.

4.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少,随机器运转的速度而变化,下表为抽样试验的结果:

转速x(转/秒) 每小时生产有缺点的零件数y(件) 对变量y与x进行线性相关性检验.

--

解:由题中数据可得x=12.5,y=8.25,∑xiyi=438, --22

4x y=412.5,∑xi=660,∑yi=291,所以

4

4

4

16 11 14 9 12 8 8 5 (660-625)×(291-272.25)25.5=≈0.995.

656.25

由检验水平0.05及n-2=2在教材附录表2中查得r0.05=0.950,因为r>r0.05,所以y与x具有线性相关关系.

对两个相关变量进行线性回归分析时,首先判断两个变量是否线性相关,可以通过散点图和相关系数判断,然后再求线性回归方程,对问题进行预测,否则求出的回归方程无意义,预测也无价值.

438-412.5

欢迎使用下载!

初高中精品文档

课下能力提升(十九)

一、填空题

1.下列命题中正确的是________(填所有正确命题的序号). ①任何两个变量都具有相关关系; ②圆的周长与圆的半径具有相关关系;

③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的线性回归方程可能是没有意义的; ⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究.

解析:显然①是错误的;而②中,圆的周长与圆的半径的关系为C=2πR,是一种确定性的函数关系.

答案:③④⑤

2.已知x,y的取值如下表: x 0 1 3 4 y 2.2 4.3 4.8 6.7 从所得的散点图分析,y与x线性相关,且y ∧=0.95x+a ∧,则a ∧=________.

----

解析:∵x=2,y=4.5.又回归直线恒过定点(x,y),代入得a ∧=2.6. 答案:2.6 3.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y ∧=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以估计其体重为________.

解析:y ∧=0.849×172-85.712=60.316. 答案:60.316 kg 4.有下列关系:

①人的年龄与他(她)拥有的财富之间的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;

④森林中的同一种树木,其断面直径与高度之间的关系; ⑤学生与其学号之间的关系.

其中有相关关系的是____________.(填序号) 解析:由相关关系定义分析. 答案:①③④

5.某产品的广告费用x与销售额y的统计数据如下表: 广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54 根据上表可得线性回归方程y=b ∧x+a ∧中的b ∧为9.4,据此模型预报广告费用为6万元时销售额为________万元.

解析:样本中心点是(3.5,42),

欢迎使用下载!

初高中精品文档

答案:65.5 二、解答题

6.下面是水稻产量与施肥量的一组观测数据: 施肥量 水稻产量 15 320 20 330 25 360 30 410 35 460 40 470 45 480 (1)将上述数据制成散点图;

(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗? 解:(1)散点图如下:

(2)从图中可以发现施肥量与水稻产量具有线性相关关系,当施肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施肥量和水稻产量近似成线性正相关关系.

7.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为

价格x 需求量y 1 1.4 12 2 1.6 10 3 1.8 7 4 2 5 5 2.2 3

2

已知∑5,i=1xiyi=62,∑5,i=1xi=16.6. (1)画出散点图;

(2)求出y对x的线性回归方程;

(3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t) 解:(1)散点图如下图所示:

11

(2)因为x=×9=1.8,y=×37=7.4,

55

欢迎使用下载!

初高中精品文档

8.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩:

数学(x) 物理(y) 88 94 83 91 117 108 92 96 108 104 100 101 112 106

(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.

-12-17+17-8+8+12-

解:(1)∵x=100+=100;

7-

y=100+

2数学

-6-9+8-4+4+1+6

=100;

7

2物理

∴σ=

2

994

=142,σ7

2

250, 7

从而σ数学>σ物理,∴物理成绩更稳定.

(2)由于x与y之间具有线性相关关系,因为

7

7

2

∑xiyi=70 497,∑xi=70 994, 所以根据回归系数公式得到

当y=115时,x=130,即该生物理

成绩达到115分时,他的数学成绩大约为130分. 建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.

欢迎使用下载!

初高中精品文档

欢迎使用下载!

本文来源:https://www.bwwdw.com/article/b6g7.html

Top