高中数学北师大版选修2-3学案:3.1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析 Word版含解析

更新时间:2024-01-21 22:39:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

§1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析

1.了解回归分析的思想和方法.(重点)

2.掌握相关系数的计算和判断线性相关的方法.(重点)

3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)

[基础·初探]

教材整理1 回归分析

阅读教材P73~P75,完成下列问题.

设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:

lxyb=l=xx

i=1

? ?xi-x??yi-y??xiyi-nx y

i=1

nn

i=1

? ?xi-x?

n

=2

i=1

?xi2-nx2

n

,a=y-bx.

教材整理2 相关系数

阅读教材P76~P78,完成下列问题. 1.相关系数r的计算

假设两个随机变量的数据分别为(x1,y1),(x2,y2),?,(xn,yn),则变量间线性相关系数

lxyr==

lxxlyy

i=1n

? ?xi-x??yi-y?

2

n

i=1

? ?xi-x?

i=1

? ?yi-y?2

n

i=1

?xiyi-nx y

. x

2

2

?y2i-nyn

n

x2i-n

i=1

?

n

i=1

2.相关系数r与线性相关程度的关系 (1)r的取值范围为[-1,1];

(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高; (3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低. 3.相关性的分类

(1)当r>0时,两个变量正相关; (2)当r<0时,两个变量负相关; (3)当r=0时,两个变量线性不相关.

判断(正确的打“√”,错误的打“×”)

(1)两个变量的相关系数r>0,则两个变量正相关.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若两个变量负相关,那么其回归直线的斜率为负.( ) 【答案】 (1)√ (2)× (3)√ 教材整理3 可线性化的回归分析 阅读教材P79~P82,完成下列问题.

1.非线性回归分析

对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.

2.非线性回归方程

曲线 方程 变换 公式 c=ln a y=axb (a=1,b>0)(a=1,b<0) bx曲线图形 变换后的 线性函数 v=ln x u=ln y c=ln a u=c+bv y=ae (a>0,b>0)(a>0,b<0) u=ln y c=ln a u=c+bx by=aex (a>0,b>0)(a>0,b<0) 1v=x u=ln y v=ln x u=c+bv y=a+ bln x (b>0) (b<0) u=y

u=a+bv 下列数据x,y符合哪一种函数模型( )

x y 1 2 2 2.69 3 3 4 3.38 5 3.6 6 3.8 7 4 8 4.08 9 4.2 10 4.3 1A.y=2+3x 1

C.y=2ex

B.y=2ex D.y=2+ln x

【解析】 分别将x的值代入解析式判断知满足y=2+ln x. 【答案】 D

[质疑·手记]

预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流: 疑问1: 解惑: 疑问2: 解惑:

[小组合作型] 变量间的相关关系及判定 (1)对变量x,y有观测数据(xi,yi)(i=1,2,?,10),得散点图3-1-1

①,对变量u,v有观测数据(ui,vi)(i=1,2,?,10),得散点图②.由这两个散点图可以判断( )

图3-1-1

A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关

(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法: ①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( )

A.①② C.①③

B.②③ D.①②③

(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正

方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是

( )

A.①③ C.②⑤

B.②④ D.④⑤

【精彩点拨】 可借助于线性相关概念及性质作出判断.

【自主解答】 (1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.

(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.

(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C. 【答案】 (1)C (2)C (3)C

1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.

2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.

[再练一题]

1.下列两变量中具有相关关系的是( )

【导学号:62690052】

A.正方体的体积与边长 B.人的身高与体重

C.匀速行驶车辆的行驶距离与时间 D.球的半径与体积

【解析】 选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的

4

体积是3π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.

【答案】 B

求线性回归方程 (2016·九江高二检测)某服装商场为了了解毛衣的月销售量y(件)与月

平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:

月平均气温x(℃) 月销售量y(件) 17 24 13 33 8 40 2 55 (1)算出线性回归方程y=bx+a.(a,b精确到0.1) (2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.

【精彩点拨】 (1)可利用公式求解; (2)把月平均气温代入回归方程求解.

【自主解答】 (1)由散点图易判断y与x具有线性相关关系. x=(17+13+8+2)÷4=10, y=(24+33+40+55)÷4=38,

4

∑ xiyi=17×24+13×33+8×40+2×55=1 267,

i=14

∑ xi2=526,

i=1

4

∑ xiyi-4x yb=

i=14 2

∑ x2i-4x

i=1

1 267-4×10×38

526-4×102≈-2.01,

a=y-bx≈38-(-2.01)×10=58.1, 所以线性回归方程为y=-2.0x+58.1.

(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y=-2.0 x+58.1=-2.0×6+58.1≈46(件).

1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.

2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.

3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.

4.回归直线必过样本点的中心点.

[再练一题]

2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:

x y 6 2 8 3 10 5 12 6 (1)请画出上表数据的散点图(要求:点要描粗); (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;

(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 【解】 (1)如图:

4

(2) ∑ xiyi=6×2+8×3+10×5+12×6=158,

i=1

6+8+10+12x==9,

4y=

4

2+3+5+6

=4, 4

∑ xi2=62+82+102+122=344,

i=1

b=

158-4×9×414

=20=0.7,

344-4×92a=y-bx=4-0.7×9=-2.3, 故线性回归方程为y=0.7x-2.3.

(3)由(2)中线性回归方程得当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.

[探究共研型] 可线性化的回归分析 探究1 如何解答非线性回归问题? 【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:

探究2 已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?

x y ①y=3×2x-1; ③y=4x;

1 3 2 5.99 ②y=log2x; ④y=x2.

3 12.01 【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.

某地区不同身高的未成年男性的体重平均值如下表: 身高x(cm) 体重y(kg) 身高x(cm) 体重y(kg) 60 6.13 120 20.92 70 7.90 130 26.86 80 9.99 140 31.11 90 12.15 150 38.85 100 15.02 160 47.25 110 17.50 170 55.05 (1)试建立y与x之间的回归方程; (2)如果一名在校男生身高为168 cm,预测他的体重约为多少?

【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.

【自主解答】 (1)根据表中的数据画出散点图,如下:

由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=

ln y,列表如下:

x z x z 60 1.81 120 3.04 70 2.07 130 3.29 80 2.30 140 3.44 90 2.50 150 3.66 100 2.71 160 3.86 110 2.86 170 4.01 作出散点图,如下:

由表中数据可求得z与x之间的回归直线方程为^z=0.693+0.020x,则有y=e0.693+0.020x.

(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.

两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z=bx+a?a=ln c1,b=c2?的周围.

[再练一题]

3.在一次抽样调查中测得样本的5个样本点,数据如下表:

x y 0.25 16 0.5 12 1 5 2 2 4 1 试建立y与x之间的回归方程. 【解】 作出变量y与x之间的散点图如图所示.

由图可知变量y与x近似地呈反比例函数关系.

k1

设y=x,令t=x,则y=kt.由y与x的数据表可得y与t的数据表:

t y 4 16 2 12 1 5 0.5 2 0.25 1 作出y与t的散点图如图所示.

由图可知y与t呈近似的线性相关关系.

又t=1.55,y=7.2,?tiyi=94.25,?t2i=21.312 5,

i=1

i=1

5

5

i=1

?tiyi-5ty?ti2-5t2

5

5

b= i=1

94.25-5×1.55×7.2

≈4.134 4,

21.312 5-5×1.552a=y-bt=7.2-4.134 4×1.55≈0.8, ∴y=4.134 4t+0.8.

所以y与x的回归方程是y=

4.134 4

x+0.8. [构建·体系]

1.下列结论正确的是( )

①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

A.①② C.①②④

B.①②③ D.①②③④

【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.

【答案】 C

2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )

x y A.(2,3) C.(2.5,4)

1 1 2 3 B.(1.5,4) D.(2.5,5)

3 5 4 7 【解析】 线性回归方程必过样本点的中心(x,y), 即(2.5,4),故选C. 【答案】 C

3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.

【导学号:62690053】

【解析】 由题意知x=2,y=3,b=6.5,所以a=y-bx=3-6.5×2=-10,即回归直线的方程为y=-10+6.5x.

【答案】 y=-10+6.5x

4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):

固定资产价值 工业增加值 3 15 3 17 5 25 6 28 6 30 7 36 8 37 9 42 9 40 10 45 根据上表资料计算的相关系数为________. 3+3+5+6+6+7+8+9+9+10【解析】 x==6.6.

10y=

15+17+25+28+30+36+37+42+40+45

=31.5.

10

10

∑ ?xi-x??yi-y?

∴r=

i=1 1010=0.991 8.

∑ ?xi-x?2i=1

∑ ?yi-y?2

i=1

【答案】 0.991 8

5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

单价x(元) 销量y(件) 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68 (1)求回归直线方程y=bx+a,其中b=-20,a=y-bx;

(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)

1

【解】 (1)x=(8+8.2+8.4+8.6+8.8+9)=8.5,

61

y=6(90+84+83+80+75+68)=80, ∵b=-20,a=y-bx, ∴a=80+20×8.5=250, ∴回归直线方程为y=-20x+250.

(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-

?33?2

20?x-4?+361.25, ??

33

∴该产品的单价应定为4元时,工厂获得的利润最大.

我还有这些不足:

(1) (2)

我的课下提升方案: (1) (2)

学业分层测评

(建议用时:45分钟)

[学业达标]

一、选择题

1.为了考查两个变量x和y之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都为t,那么下列说法中正确的是( )

A.直线l1和l2都过点(s,t)

B.直线l1和l2相交,但交点不一定是(s,t) C.直线l1和l2必平行 D.直线l1和l2必重合

【解析】 线性回归方程y=bx+a恒过点(x,y),故直线l1和l2都过点

(s,t).

【答案】 A

2.已知人的年龄x与人体脂肪含量的百分数y的回归方程为y=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量( )

A.一定是20.3%

B.在20.3%附近的可能性比较大 C.无任何参考数据 D.以上解释都无道理

【解析】 将x=36代入回归方程得y=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.

【答案】 B

3.关于回归分析,下列说法错误的是( ) A.回归分析是研究两个具有相关关系的变量的方法 B.线性相关系数可以是正的或负的 C.回归模型中一定存在随机误差 D.散点图表明确反映变量间的关系

【解析】 用散点图反映两个变量间的关系时,存在误差,故D错误. 【答案】 D

4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:

x y 1.99 1.5 3 4.04 4 7.5 5.1 12 6.12 18.01 对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 C.y=log2x

?1?B.y=?2?x

??1

D.y=2(x2-1)

【解析】 代入检验,当x取相应的值时,所得y值与已知数据差的平方和最小的便是拟合程度最高的.

【答案】 D

5.某产品的广告费用x与销售额y的统计数据如下表:

广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( )

A.63.6万元 C.67.7万元

B.65.5万元 D.72.0万元

【解析】 样本点的中心是(3.5,42),则a=y-bx=42-9.4×3.5=9.1,所以回归直线方程是y=9.4x+9.1,把x=6代入得y=65.5.

【答案】 B 二、填空题

6.回归分析是处理变量之间________关系的一种数量统计方法.

【导学号:62690054】

【解析】 回归分析是处理变量之间相关关系的一种数量统计方法. 【答案】 相关

7.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(x,y)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.

【解析】 ∵r<0时b<0, ∴大多数点落在第二、四象限. 【答案】 二、四

8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.

【解析】 儿子和父亲的身高可列表如下:

父亲身高 儿子身高 173 170 170 176 176 182 设线性回归方程y=a+bx,由表中的三组数据可求得b=1,故a=y-bx=176-173=3,故线性回归方程为y=3+x,将x=182代入得孙子的身高为185 cm.

【答案】 185

三、解答题

9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:

x y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 如由资料可知y对x呈线性相关关系.试求: ?x-y??xy-n-

?? -

(1)线性回归方程:a=y-bx,b=

??x-n?x????

n

iii=1n

2

i

2

i=1

(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x=y=

2+3+4+5+6

=4,

5

2.2+3.8+5.5+6.5+7.0

=5,

5

5

2

xi=90,xiyi=112.3, i=1i=1

?

5

?

i=1

x-y?xiyi-5-

2

?x2i-5x5

5

b==112.3-5×4×5

=1.23.

90-5×42i=1

于是a=y-bx=5-1.23×4=0.08. 所以线性回归方程为y=1.23x+0.08.

(2)当x=10时,y=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.

10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.

气温/℃ 杯数 26 20 18 24 13 34 10 38 4 50 -1 64 画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.

【解】 画出散点图如图所示.

1

x=6(26+18+13+10+4-1)≈11.7, 1

y=6(20+24+34+38+50+64)≈38.3,

i=1

?xxiyi=26×20+18×24+13×34+10×38+4×50-1×64=1 910,

6

6

i=1

?xxi2=262+182+132+102+42+(-1)2=1 286,

6

i=1

?xyi2=202+242+342+382+502+642=10 172,

由r=

∑ xy-nx yi=1ii

2∑ x-nii=1nh

x

2

2

∑ y-ni=1i

n,

y2

可得r ≈0.97.

由于r的值较大,所以x与y具有很强的线性相关关系.

[能力提升]

1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间x与数学成绩y进行数据收集如表:

x y 15 102 16 98 18 115 19 115 22 120 由表中样本数据求得回归方程为y=bx+a,则点(a,b)与直线x+18y=100的位置关系是( )

A.a+18b<100

B.a+18b>100 C.a+18b=100

D.a+18b与100的大小无法确定

1

【解析】 x=5(15+16+18+19+22)=18, 1

y=5(102+98+115+115+120)=110, 所以样本数据的中心点为(18,110), 所以110=18b+a,

即点(a,b)满足a+18b=110>100. 【答案】 B

2.已知x与y之间的几组数据如下表:

x y 1 0 2 2 3 1 4 3 5 3 6 4 假设根据上表数据所得线性回归直线方程为y=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是

( )

A.b>b′,a>a′ C.ba′

B.b>b′,a

【解析】 由(1,0),(2,2)求b′,a′. b′=

2-0

=2, 2-1

a′=0-2×1=-2. 求b,a时,

i=1

?xiyi=0+4+3+12+15+24=58,

13

x=3.5,y=6,

6

i=1

?x2i=1+4+9+16+25+36=91,

6

13

58-6×3.5×6

5

∴b==7, 91-6×3.521351351

a=6-7×3.5=6-2=-3, ∴ba′. 【答案】 C

3.(2016·江西吉安高二检测)已知x,y的取值如下表所示,由散点图分析可知y与x线性相关,且线性回归方程为y=0.95x+2.6,那么表格中的数据m的值为________.

x y 0 2.2 1 4.3 3 4.8 4 m 0+1+3+42.2+4.3+4.8+m11.3+m-【解析】 x==2,y==,把(x,

44411.3+m-

y)代入回归方程得4=0.95×2+2.6,解得m=6.7.

【答案】 6.7

4.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:

x y

x y 19.5 2.5 21.5 2.4 23.5 2.3 25.5 2.2 27.5 2.1 9.5 6 11.5 4.6 13.5 4 15.5 3.2 17.5 2.8 散点图显示出x与y的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存b

在关系式:y=a+x.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.

1

【解】 设u=x,则y≈a+bu,得下表数据:

u y

0.105 3 6 0.087 0 4.6 0.074 1 4 0.064 5 3.2 0.057 1 2.8 u y 0.051 3 2.5 0.046 5 2.4 0.042 6 2.3 0.039 2 2.2 0.036 4 2.1 进而可得n=10,u≈0.060 4,y=3.21,

i=1

?uu2i-10u2≈0.004 557 3,

10

10

i=1

?uiyi-10u y≈0.256 35,

0.256 35

b≈0.004 557 3≈56.25, a=y-b·u≈-0.187 5,

56.25

所求的回归方程为y=-0.187 5+x.

当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.

u y 0.051 3 2.5 0.046 5 2.4 0.042 6 2.3 0.039 2 2.2 0.036 4 2.1 进而可得n=10,u≈0.060 4,y=3.21,

i=1

?uu2i-10u2≈0.004 557 3,

10

10

i=1

?uiyi-10u y≈0.256 35,

0.256 35

b≈0.004 557 3≈56.25, a=y-b·u≈-0.187 5,

56.25

所求的回归方程为y=-0.187 5+x.

当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.

本文来源:https://www.bwwdw.com/article/kgro.html

Top