2022年高考数学第68讲 变量的相关性、回归分析、独立性检验

更新时间:2023-04-08 04:26:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第68讲 变量的相关性、回归分析、独立性检验

1.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)

的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n)都在直线y =12

x +1上,则这组样本数据的样本相关系数为(D )

A .-1

B .0

C .12

D .1

由题意知,这组样本数据完全正相关,故相关系数为1,选D .

2.设某大学的女生的体重y(单位:kg )与身高x(单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为y =0.85x -85.71,则

下列结论中不正确...

的是(D ) A .y 与x 具有正的线性相关关系

B .回归直线过样本点的中心(x -,y -)

C .若该大学某女生的身高增加1 cm ,则其体重约增加0.85 kg

D .若该大学某女生的身高为170 cm ,则可断定其体重必为58.79 kg

A 、

B 、

C 均正确,是回归方程的性质.

D 项是错误的,线性回归方程只能预测学生的体重,选项D 应改为“若该大学某女生身高为170 cm ,则估计其体重大约为58.79 kg ”才正确.

3.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

收入x(万元)

8.2 8.6 10.0 11.3 11.9 支出y(万元)

6.2

7.5

8.0 8.5

9.8 A .11.4万元 B .11.8万元

C .12.0万元

D .12.2万元

由题意知,x -=8.2+8.6+10.0+11.3+11.95

=10, y -=6.2+7.5+8.0+8.5+9.85

=8, 所以a =8-0.76×10=0.4,

所以当x =15时,y =0.76×15+0.4=11.8(万元).

4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

男 女 总计

爱好

40 20 60 不爱好

20 30 50 总计

60 50 110 由K 2=n (ad -bc 2

(a +b )(c +d )(a +c )(b +d )

算得, K 2=110×(40×30-20×20)2

60×50×60×50

≈7.8. 附表:

P(K 2≥k) 0.050 0.010 0.001

A .有99%以上的把握认为“爱好该项运动与性别有关”

B .有99%以上的把握认为“爱好该项运动与性别无关”

C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

D .在犯错误的概率不超过0.1%

的前提下,认为“爱好该项运动与性别无关” 因为7.8>6.635,所以99%以上的把握认为“爱好该项运动与性别有关”,选A . 5.对于一组数据的两个函数模型,模型Ⅰ和模型Ⅱ的残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选 模型Ⅰ .

残差平方和越小,函数模型对数据的拟合效果越好;残差平方和越大,说明

函数模型对数据的拟合效果越差. 6.已知x 、y

从所得的散点图分析,a = 2.6 .

因为回归直线方程必过样本点的中心(x -,y -

),

解得x -=2,y -

=4.5,将(2,4.5)代入y =0.95x +a ,可得a =2.6.

7.(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民

(1)求(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.

附:回归方程y =b t +a 中,b =∑i =1

n

t i y i -n t y

∑i =1

n

t 2i -n t

2

,a =y -

-b

t .

(1)列表计算如下:

这里n =5,t =1n ∑i =1

n t i =15

5

=3,

y -=1n ∑i =1

n y i =365=7.2. 又l tt =∑i =1

n t 2i -n t 2=55-5×32=10,

l ty =∑i =1n

t i y i -n t -y -=120-5×3×7.2=12,

从而b =l ty l tt =1210

=1.2, a =y --b t =7.2-1.2×3=3.6,

故所求回归方程为y =1.2t +3.6.

(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y =1.2×6+3.6=10.8(千亿元).

8.(2015·湖北卷)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是(C )

A .x 与y 正相关,x 与z 负相关

B .x 与y 正相关,x 与z 正相关

C .x 与y 负相关,x 与z 负相关

D .x 与y 负相关,x 与z 正相关

因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b y +a ,b >0,则z =b y +a =-0.1b x +b +a ,故x 与z 负相关.

9.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过这种血清的人与另外500名未使用这种血清的人一年中的感冒记录比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2=3.918,经查临界值表知P(K 2≥3.841)≈0.05.下列结论中,正确结论的序号是 ① .

①有95%的把握认为“这种血清能起到预防感冒的作用”;

②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;

③这种血清预防感冒的有效率为95%;

④这种血清预防感冒的有效率为

5%.

因为K 2=3.918≥3.841,而P(K 2≥3.841)≈0.05,

所以有95%的把握认为“这种血清能起到预防感冒的作用”.

10.(2016·湖北省八校第二次联考)国内某知名大学有男生14000人,女生10000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表:(平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是[0,3])

(2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.

①请根据样本估算该校“运动达人”的数量;

②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过0.05

参考公式:K 2

=n (ad -bc )(a +b )(c +d )(a +c )(b +d )

,其中n

=a +

b +

c +d.

(1)由分层抽样得,男生抽取的人数为120×14000

14000+10000

=70人,女生抽取

的人数为120-70=50人,故x =5,y =2,

则该校男生平均每天运动的时间为: 1

70

(0.25×2+0.75×12+1.25×23+1.75×18+2.25×10+2.75×5)≈1.5, 故该校男生平均每天运动的时间约为1.5小时.

(2)①样本中“运动达人”所占比例是20120=1

6

,故估计该校“运动达人”有

1

6

×(14000+10000)=4000人.

②由表格可知:,

故K 2的观测值

k =120(15×45-5×55)220×100×50×70

=9635≈2.743<3.841.

故在犯错误的概率不超过0.05的前提下不能认为“是否为'运动达人'与性别有关”.

本文来源:https://www.bwwdw.com/article/vzxl.html

Top