概率论与数理统计 浙大第四版课后答案 第9章
更新时间:2023-09-04 19:24:01 阅读量: 教育文库 文档下载
数理统计(浙大第四版)习题解 第9章 回归分析
【习题9.8】下表数据是退火温度x(℃)对黄铜延性y效应的试验结果,y是以延长度计算的。
x(℃)
y(%)
300 40
400 50
500 55
600 60
700 67
800 70
画出散点图并求y对于x的线性回归方程。 〖解〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。
图9.8-1 试验点的线性相关趋势
分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。
x
300 400 500 600 700 800
样本数据预处理表
y
40 50 55 60 67 70
n=6
xy= 198400
x=3300 x=1990000
2 y=342 y=20114
2
设SP,SSx,SSy分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下
1 n n 1
SP xiyi xi yi 198400 3300 342 10300
n i 1 i 1 6i 1
n
1 n 12
SSx xi xi 1990000 33002 175000
n i 1 6i 1
1 n 12
SSy yi yi 20114 3422 620
n i 1 6i 1
回归参数估计如下
n
2
n
2
SP 10300 0.058857142 b
SSx175000
1 342 10300 3300 24.62857143 a
61750006
故线性回归方程为
24.62857143
0.058857142x bx ay
图9.8-2 试验点的线性拟合
【习题9.9】在钢线碳含量对于电阻的效应的研究中,得到以下的数据:
碳含量x(﹪) 0.10 0.30 0.40 0.55 0.70 0.80
电阻y(20℃时,微欧) 试完成下述任务:
(1)画出散点图;
15
18
19
21
22.6
23.8
0.95 26
x; a b(2)求线性回归方程y
(3)求 的方差 2的无偏估计;
(4)检验假设H0:b 0;H1:b 0;
(5)若回归效果显著,求b的置信水平为0.95的置信区间; (6)求x 0.50处 (x)的置信水平为0.95的置信区间; (7)求x 0.50处观察值y的置信水平为0.95的预测区间。 〖解(1)〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有很强的线性相关趋势。
图9.9-1 试验点的线性相关趋势
〖解(2)〗
分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。
x
0.10
0.30 0.40 0.55 0.70 0.80 0.95
样本数据预处理表
y
15 18 19 21 22.6 23.8 26
n=7
xy=85.61
x=3.8 x=2.595
2 y=145.4 y=3104.2
2
设SP,SSx,SSy分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下
1 n n 1
SP xiyi xi yi 85.61 3.8 145.4 6.67857143
n i 1 i 1 7i 1
1 n 12
SSx xi xi 2.595 3.82 0.532142857
n i 1 7i 11 n 12
SSy yi yi 3104.2 145.42 84.0342858
n i 1 7i 1
回归参数估计如下
n
2
n
2
n
SP 6.67857143 12.55033558 b
SSx0.532142857
1 145.4 6.67857143 3.8 13.95838926 a
70.5321428577
故线性回归方程为
13.95838926
12.55033558x bx ay
图9.9-2 试验点的线性拟合
〖解(3)〗
计算残差平方和及误差均方如下
6.678571432
SSE SSy SPSSx 84.0342858 0.215973183
0.532142857
2
MSE
2
SSE0.215973183
0.043194636 n 27 2
2
MSE 0.043194636 方差 的无偏估计:
〖解(4)〗
检验模型的显著性等价于检验下面的假设
H0:b 0H1:b 0
一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下
SST SSy 84.0342858 SSE 0.215973183
SP26.678571432
SSR 83.81831262
SSx0.532142857
方差分析表
方差来源 模型 误差 总和
平方和 83.81831262 0.215973183 84.0342858
自由度 1 5 6
均方 83.81831262 0.043194636
F值
1940.479634
F0.05 1,5
6.61
因为MSRMSE 1940.479634 6.61,故0.05水平上拒绝H0,即确认回归显著。 〖解(5)〗
及其变换遵从下面的该在回归模型中假定误差是均值为0的正态随机偏差,则统计量b
旅分布
2
b
N b,
SSx
t dfE
故b的置信水平为0.95的置信区间为:
b t(df 12.55033558 t 2E0.025
12.55033558 2.5706
12.55033558 0.732378006
〖解(6)〗
为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“x 0.50处 (x)的置信水平为0.95的置信区间”指“x0 0.50处 x0 的置信水平为0.95的置信
0遵从下面的正态分布 区间”。考虑统计量y
2
2 x 1 0 bx0 N x0 , 0 ay
nSSx
xy
t dfE
于是,x0 0.50处 x0 的置信水平为0.95的置信区间为
y 0 t 2
dfE
13.95838926 12.55033558 0.5 20.23355705 bx 0 ay0
t
dfE t0.025
5 2.5706 0.079496868 0.20435465
y 0 t
dfE 20.23355705 0.20435465
〖解(7)〗
为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“x 0.50处观察值y的置信水平为0.95的预测区间”指“x0 0.50处y0的置信水平为0.95的置信
0之差遵从下面的正态分布 区间”。响应y0 a bx0 与其估计y
2
1 x0 2 0 N 0, 1 y0 y
nSSx t dfE 于是,x0 0.50处y0的置信水平为0.95的置信区间为
y 0 t
dfE
13.95838926 12.55033558 0.5 20.23355705 bx 0 ay0
t
dfE t0.025
5 2.5706 0.222518287 0.572005508
y 0 t 2
dfE 20.23355705 0.572005508
【习题9.10】下表列出了18名5-8岁儿童的重量(这是容易测得的)和体积(这是难以测
量的)。
重量x
体积y
重量x 体积y
17.1 16.7 15.8 15.2
10.5 10.4 15.1 14.8
13.8 13.5 12.1 11.9
15.7 15.7 18.4 18.3
11.9 11.6 17.1 16.7
10.4 10.2 16.7 16.6
15.0 14.5 16.5 15.9
16.0 15.8 15.1 15.1
17.8 17.6 15.1 14.5
(1) 画出散点图。
x。
a b(2) 求y关于x的线性回归方程y
(3) 求x 14.0时观察值y的置信水平为0.95的预测区间。 〖解(1)〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。
图9.10-1 试验点的线性相关趋势
〖解(2)〗
分别计算x、y的样本和、样本平方和及它们的乘积和如下表。
x
17.1
10.5 13.8 15.7 11.9 10.4 15.0 16.0 17.8 15.8 15.1 12.1
样本数据预处理表
y
16.7 10.4 13.5 15.7 11.6 10.2 14.5 15.8 17.6 15.2 14.8 11.9
n=18
xy=4071.71
18.4 17.1 16.7 16.5 15.1 15.1 18.3 16.7 16.6 15.9 15.1 14.5
x=270.1 x=4149.39
2 y=265 y=3996.14
2
分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下
1 n n 1
SP xiyi xi yi 4071.71 270.1 265 95.237778
n i 1 i 1 18i 1
1 n 12
SSx xi xi 4149.39 270.12 96.3894445
n i 1 18i 11 n 12
SSy yi yi 3996.14 2652 94.7511112
n i 1 18i 1
回归参数估计如下
n
2
n
2
n
SP 95.237778 0.988051943 b
SSx96.3894445
1 265 95.237778 270.1 0.104046111 a
1896.389444518
故线性回归方程为
0.104046111
0.988051943x bx ay
图9.10-2 试验点的线性拟合
〖解(3)〗
为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“求x 14.0
时观察值y的置信水平为0.95的预测区间”指“x0 14.0处y0的置信水平为0.95的置信
0之差遵从下面的正态分布 区间”。响应y0 a bx0 与其估计y
2 2 x 1 0
0 N 0, 1 y0 y
nSSx t dfE 于是,x0 14.0处y0的置信水平为0.95的置信区间为
y 0 t
dfE
0.104046111 0.988051943 14.0 13.72868109 bx 0 ay0
95.2377782
SSE SSy SPSSx 94.7511112 0.651239525
96.3894445
2
MSE
SSE0.651239525
0.04070247 n 218 2
t 2
dfE t0.025
16 2.1199 0.208304331 0.441584351
y 0 t
dfE 13.72868109 0.441584351
【习题9.11】蟋蟀用一个翅膀在另一个翅膀上快速地滑动,从而发出吱吱喳喳的叫声。生物学家知到叫声的频率x(叫声数/秒)与气温y具有线性关系。下表列出了15对频率与气温的对应观察结果:
频率x(1/s)
气温y(℃)
频率x(1/s) 气温y(℃)
15.4 20.8
16.2 28.5
15.0 26.4
17.2 28.1
16.0 27.0
17.0 28.6
14.4 24.6
20.0 31.4
16.0 22.0
19.8 34.1
18.4 29.1
17.1 27.0
15.5 24.0
14.7 20.9
17.1 27.8
试求y关于x的线性回归方程。 〖解〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。
图9.11-1 试验点的线性相关趋势
分别计算x、y的样本和、样本平方和及它们的乘积和如下表。
x
20.0 16.0 19.8 18.4 17.1 15.5 14.7 17.1 15.4 16.2 15.0 17.2 16.0 17.0 14.4
样本数据预处理表
y
31.4 22.0 34.1 29.1 27.0 24.0 20.9 27.8 20.8 28.5 26.4 28.1 27.0 28.6 24.6
n=15
xy=6740.71
x=249.8 x=4200.56
2 y=400.3 y=10877.81
2
分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下
1 n n 1
SP xiyi xi yi 6740.71 249.8 400.3 74.38067
n i 1 i 1 15i 1
n
1 n 12
SSx xi xi 4200.56 249.82 40.55733
n i 1 15i 11 n 12
SSy yi yi 10877.81 400.32 195.13733
n i 1 15i 1
回归参数估计如下
n
2
n
2
SP 74.38067 1.83396 b
SSx40.55733
1 400.3 74.38067 249.8 3.85494 a
1540.5573315
故线性回归方程为
3.85494
1.83396x bx ay
图9.11-2 试验点的线性拟合
【习题9.12】下面列出了自1952年~2004年各届奥林匹克运动会男子10000米赛跑的冠军的成绩(时间以min计):
年份(x) 1952
成绩(y)
年份(x) 成绩(y)
1980 27.7
1984 27.8
1988 27.4
1992 27.8
1996 27.1
2000 27.3
2004 27.1
29.3
1956 28.8
1960 28.5
1964 28.4
1968 29.4
1972 27.6
1976 27.7
。 bx a(1) 求y关于x的线性回归方程y
(2) 检验假设H0:b 0,H1:b 0,取显著性水平 0.05。 (3) 求2008年冠军成绩的预测值。 〖解(1)〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性
相关趋势。
图9.12-1 试验点的线性相关趋势
分别计算x、y的样本和、样本平方和及它们的乘积和如下表。
x
1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004
样本数据预处理表
y
29.3 28.8 28.5 28.4 29.4 27.6 27.7 27.7 27.8 27.4 27.8 27.1 27.3 27.1
n=14
xy=775035.6
x=27692 x=54778416
2 y=391.9 y=10977.99
2
分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下
1 n n 1
SP xiyi xi yi 775035.6 27692 391.9 142.6
n i 1 i 1 14i 1
1 n 12
SSx xi xi 54778416 276922 3640
n i 1 14i 11 n 1
SSy y yi 10977.99 391.92 7.589286
n i 1 14i 1
2in
2
n
2
n
回归参数估计如下
SP 142.6 0.0391758 b
SSx3640
1 391.9 142.6 27692 105.4826374 a
14364014
故线性回归方程为
105.4826374
0.0391758x bx ay
图9.12-2 试验点的线性拟合
〖解(2)〗检验假设H0:b 0,H1:b 0,取显著性水平 0.05
检验模型的显著性等价于检验下面的假设
H0:b 0H1:b 0
一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下
SST SSy 7.589286
SP2142.62SSR 5.586473
SSx3640
SSE SSy SP2SSx 7.589286 5.586473 2.002813
方差分析表
方差来源 模型
误差 总和
平方和 5.586473 2.002813 7.589286
自由度 1 12 13
均方 5.586473 0.166901
F值
33.4718
F0.05 1,12
4.75
因为MSRMSE 33.4718 4.75,故0.05水平上拒绝H0,即确认回归显著。
〖解(3)〗
由回归方程预测2008年冠军的成绩如下
105.4826374 0.0391758 2008 26.8176 min 0 a bxy0
结论:2008年冠军的预测成绩为26.82min。
【习题9.13】以x和y分别表示人的脚长(英寸,1inch=2.54cm)与手长(英寸),下面列出了15名女子的脚的长度x与手的长度y的样本值:
脚长x 9.00 8.50 9.25 9.75 9.00
手长y
脚长x 手长y
9.25 7.00
9.50 7.00
9.25 7.00
10.00 10.00 7.50
7.25
9.75 7.25
9.50 7.25
6.50
6.25
7.25
7.00
6.75
10.00 7.00
9.50 6.50
9.00 7.00
。 bx a(1) 求y关于x的线性回归方程y
(2) 求
b的置信水平为0.95的置信区间。
bx a〖解(1)〗求y关于x的线性回归方程y
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。
图9.13-1 试验点的线性相关趋势
分别计算x、y的样本和、样本平方和及它们的乘积和如下表。
x
9.00 8.50 9.25 9.75 9.00 10.00 9.50
样本数据预处理表
y
6.50 6.25 7.25 7.00 6.75 7.00 6.50
n=15 xy=985.5
9.00 9.25 9.50 9.25 10.00 10.00 9.75 9.50 7.00 7.00 7.00 7.00 7.50 7.25 7.25 7.25
x=141.25 x=1332.8125
2 y=104.5 y=729.625
2
分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下
1 n n 1
SP xiyi xi yi 985.5 141.25 104.5 1.4583333
n i 1 i 1 15i 1
1 n 1
SSx x xi 1332.8125 141.252 2.7083333
n i 1 15i 1
2in
2
n
1 n 12
SSy yi yi 729.625 104.52 1.6083333
n i 1 15i 1
回归参数估计如下
n
2
SP 1.4583333 0.53846 b
SSx2.7083333
1 104.5 1.4583333 141.25 1.89615 a
152.708333315
故线性回归方程为
1.89615
0.53846x bx ay
图9.13-2 试验点的线性拟合
〖解(2)〗求b的置信水平为0.95的置信区间
及其变换遵从下面的分布 回归模型中假定误差服从均值为0的正态分布,则统计量b
2
Nb,b
SSx
t dfE
计算误差平方和与误差均方如下
SP21.45833332
SSE SSy 1.6083333 0.8230769
SSx2.7083333
MSE
SSE0.8230769
0.0633136 n 215 2
故b的置信水平为0.95的置信区间为:
b t(df 0.53846 t 2E0.025
0.53846 2.1604 0.53846 0.33032 0.20814,0.86878
【习题9.14】槲寄生是一种寄生在大树上部树枝上的寄生植物。它喜欢寄生在年轻的大树上。下面给出一定条件下完成的试验中采集的数据。
大树的年龄x 每株大树上槲
寄生的株数y
3 28 33 22
4 10 36 24
9 15 22 10
15 6 14 9
40 1 1
(1)作出(xi,yi)的散点图。
(2)令zi lnyi,作出(xi,zi)的散点图。 (3)以模型y ae
bx
, ~N(0, 2)拟合数据,其中a
,b, 2与x无关,试求曲线回归方
ebx。 a程y
〖解(1)〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x具有指数相关的趋势。
图9.14-1 原始数据试验点变量相关的动态特征
〖解(2)〗
采用MATLAB编程绘(xi,lnyi)的散点图。由图可见,变量lny与x之间具有线性相关的趋势。
图9.14-2 对数变换后试验点变量相关的动态特征
〖解(3)〗
设 x,y 表原始数据, X,Y 表变换后的数据。由于模型y ae
bx
可变换为线性模型
Y lny
y aebx X x
Y X lna lny lna bx
b
故可采用线性回归实现模型y ae
bx
对试验数据的拟合,即求回归函数y ae的最
bx
。 ae小二乘估计y
bx
X,先分别求X、Y的样本和、样本平方和 为求Y关于X的线性回归方程Y
及它们的乘积和,详见下表。
样本数据预处理表
x
3
4 9 15 40 3 4 9 15 40 3
y
28 10 15 6 1 33 36 22 14 1 22
X
3 4 9 15 40 3 4 9 15 40 3
Y
3.3322 2.3026 2.7081 1.7918 0 3.4965 3.5835 3.0910 2.6391 0 3.0910
数据预处理
4 9 15
2
24 10 9 4 9 15
2
3.1781 2.3026 2.1972
X=173 X=4193
n
Y=33.7136315 Y=98.3200266
n=14
XY=238.3516154
分别计算XY的校正叉积和、X的校正平方和、Y的校正平方和SP,SSX,SSY如下
1 n n
SP XiYi Xi Yi
n i 1 i 1 i 1
238.3516154
n
1
173 33.7136315 178.252545314
2
1 n1 2
SSX Xi Xi 4193 1732 2055.214286
n i 1 14i 1
1 n 1
SSY Yi Yi 98.3200266 33.71363152 17.1336731
n i 1 14i 1
2n
2
回归参数估计如下
SP 178.2525453 0.0867319
SSx2055.214286
1 33.7136315 178.2525453 173 3.4798744
142055.21428614
故线性回归方程为
X 3.4798744 0.0867319X Y
还原为原非线性回归方程,则得
y eY x X bx x 0.0867319x y X Y ae ee 32.4556454e a e b
32.4556454e 0.0867319x拟合数据的效果 图9.14-3 非线性回归方程y
【习题9.15】一种合金在某种添加剂的不同浓度之下,各做三次试验,得数据如下:
浓度x 10.0 15.0 20.0 25.0 30.0
抗压强度y
(1)做散点图。
(2)以模型y b0 b1x b2x , ~N(0, )拟合数据,其中b0,b1,b2, 与x无关,
2
25.2
27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8
22
b x b
x。 b求回归方程y012
2
〖解(1)〗
采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x具有非线性相关趋势。
图9.10-1 原始数据试验点变量相关的动态特征
〖解(2)〗
设x1 x和x2 x2,则非线性回归模型y b0 b1x b2x2 可变换为线性回归模型
y b0 b1x1 b2x2 。多元线性回归的矩阵形式为
正在阅读:
健康教育知识试题及答案12-30
UG带尺寸的草图保存-2D批量绘UG-3D-2D自动标注尺寸08-26
一年级数学奥数题综合练习500题15012-20
2022预算员顶岗实习报告04-17
阅读理解题6年级11-22
探望病人的礼仪及注意事项05-15
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 数理统计
- 概率论
- 浙大
- 课后
- 答案
- 2018年中国奥特莱斯开发行业分析及发展趋势预测(目录)
- 招标人(代理机构)招投标系统使用说明后(审流程)
- 2014内蒙古事业单位考试综合基础知识:备考常识冲刺题一百零二
- 基于GPS、GPRS、GIS的电力抢修调度监控系统的设计与应用
- 浅析外来词汇对现代汉语的影响
- 江南16秋《小学德育原理与方法》大作业
- 大学体育-爱课程答案- 南京工程学院2017届新生最新版答案
- 培训学习家庭教育心得(601)1
- 收款收据领用登记表
- 工程施工罚款通知单(模板)
- 【名师导学系列】2013年高考英语人教版第一轮精品复习学案【选修七】
- 护理三基第4版试题完整答案版
- 高中时态总复习
- 体育商品店创业计划书
- 备用金申请表
- 铣工技师职业鉴定试题B
- 我的光棍节宣言模板
- 电子商务-B-第14讲
- 在EXCEl中直接调用REFPROP的设置方法
- 在Excel中,一个表格怎样直接引用另一个表格的数据?