概率论与数理统计 浙大第四版课后答案 第9章

更新时间:2023-09-04 19:24:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数理统计(浙大第四版)习题解 第9章 回归分析

【习题9.8】下表数据是退火温度x(℃)对黄铜延性y效应的试验结果,y是以延长度计算的。

x(℃)

y(%)

300 40

400 50

500 55

600 60

700 67

800 70

画出散点图并求y对于x的线性回归方程。 〖解〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。

图9.8-1 试验点的线性相关趋势

分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。

x

300 400 500 600 700 800

样本数据预处理表

y

40 50 55 60 67 70

n=6

xy= 198400

x=3300 x=1990000

2 y=342 y=20114

2

设SP,SSx,SSy分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下

1 n n 1

SP xiyi xi yi 198400 3300 342 10300

n i 1 i 1 6i 1

n

1 n 12

SSx xi xi 1990000 33002 175000

n i 1 6i 1

1 n 12

SSy yi yi 20114 3422 620

n i 1 6i 1

回归参数估计如下

n

2

n

2

SP 10300 0.058857142 b

SSx175000

1 342 10300 3300 24.62857143 a

61750006

故线性回归方程为

24.62857143

0.058857142x bx ay

图9.8-2 试验点的线性拟合

【习题9.9】在钢线碳含量对于电阻的效应的研究中,得到以下的数据:

碳含量x(﹪) 0.10 0.30 0.40 0.55 0.70 0.80

电阻y(20℃时,微欧) 试完成下述任务:

(1)画出散点图;

15

18

19

21

22.6

23.8

0.95 26

x; a b(2)求线性回归方程y

(3)求 的方差 2的无偏估计;

(4)检验假设H0:b 0;H1:b 0;

(5)若回归效果显著,求b的置信水平为0.95的置信区间; (6)求x 0.50处 (x)的置信水平为0.95的置信区间; (7)求x 0.50处观察值y的置信水平为0.95的预测区间。 〖解(1)〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有很强的线性相关趋势。

图9.9-1 试验点的线性相关趋势

〖解(2)〗

分别求x、y的样本和、样本平方和及它们的乘积和,详见下表。

x

0.10

0.30 0.40 0.55 0.70 0.80 0.95

样本数据预处理表

y

15 18 19 21 22.6 23.8 26

n=7

xy=85.61

x=3.8 x=2.595

2 y=145.4 y=3104.2

2

设SP,SSx,SSy分别表xy的校正叉积和、x的校正平方和与y的校正平方和,其值计算如下

1 n n 1

SP xiyi xi yi 85.61 3.8 145.4 6.67857143

n i 1 i 1 7i 1

1 n 12

SSx xi xi 2.595 3.82 0.532142857

n i 1 7i 11 n 12

SSy yi yi 3104.2 145.42 84.0342858

n i 1 7i 1

回归参数估计如下

n

2

n

2

n

SP 6.67857143 12.55033558 b

SSx0.532142857

1 145.4 6.67857143 3.8 13.95838926 a

70.5321428577

故线性回归方程为

13.95838926

12.55033558x bx ay

图9.9-2 试验点的线性拟合

〖解(3)〗

计算残差平方和及误差均方如下

6.678571432

SSE SSy SPSSx 84.0342858 0.215973183

0.532142857

2

MSE

2

SSE0.215973183

0.043194636 n 27 2

2

MSE 0.043194636 方差 的无偏估计:

〖解(4)〗

检验模型的显著性等价于检验下面的假设

H0:b 0H1:b 0

一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下

SST SSy 84.0342858 SSE 0.215973183

SP26.678571432

SSR 83.81831262

SSx0.532142857

方差分析表

方差来源 模型 误差 总和

平方和 83.81831262 0.215973183 84.0342858

自由度 1 5 6

均方 83.81831262 0.043194636

F值

1940.479634

F0.05 1,5

6.61

因为MSRMSE 1940.479634 6.61,故0.05水平上拒绝H0,即确认回归显著。 〖解(5)〗

及其变换遵从下面的该在回归模型中假定误差是均值为0的正态随机偏差,则统计量b

旅分布

2

b

N b,

SSx

t dfE

故b的置信水平为0.95的置信区间为:

b t(df 12.55033558 t 2E0.025

12.55033558 2.5706

12.55033558 0.732378006

〖解(6)〗

为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“x 0.50处 (x)的置信水平为0.95的置信区间”指“x0 0.50处 x0 的置信水平为0.95的置信

0遵从下面的正态分布 区间”。考虑统计量y

2

2 x 1 0 bx0 N x0 , 0 ay

nSSx

xy

t dfE

于是,x0 0.50处 x0 的置信水平为0.95的置信区间为

y 0 t 2

dfE

13.95838926 12.55033558 0.5 20.23355705 bx 0 ay0

t

dfE t0.025

5 2.5706 0.079496868 0.20435465

y 0 t

dfE 20.23355705 0.20435465

〖解(7)〗

为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“x 0.50处观察值y的置信水平为0.95的预测区间”指“x0 0.50处y0的置信水平为0.95的置信

0之差遵从下面的正态分布 区间”。响应y0 a bx0 与其估计y

2

1 x0 2 0 N 0, 1 y0 y

nSSx t dfE 于是,x0 0.50处y0的置信水平为0.95的置信区间为

y 0 t

dfE

13.95838926 12.55033558 0.5 20.23355705 bx 0 ay0

t

dfE t0.025

5 2.5706 0.222518287 0.572005508

y 0 t 2

dfE 20.23355705 0.572005508

【习题9.10】下表列出了18名5-8岁儿童的重量(这是容易测得的)和体积(这是难以测

量的)。

重量x

体积y

重量x 体积y

17.1 16.7 15.8 15.2

10.5 10.4 15.1 14.8

13.8 13.5 12.1 11.9

15.7 15.7 18.4 18.3

11.9 11.6 17.1 16.7

10.4 10.2 16.7 16.6

15.0 14.5 16.5 15.9

16.0 15.8 15.1 15.1

17.8 17.6 15.1 14.5

(1) 画出散点图。

x。

a b(2) 求y关于x的线性回归方程y

(3) 求x 14.0时观察值y的置信水平为0.95的预测区间。 〖解(1)〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较强的线性相关趋势。

图9.10-1 试验点的线性相关趋势

〖解(2)〗

分别计算x、y的样本和、样本平方和及它们的乘积和如下表。

x

17.1

10.5 13.8 15.7 11.9 10.4 15.0 16.0 17.8 15.8 15.1 12.1

样本数据预处理表

y

16.7 10.4 13.5 15.7 11.6 10.2 14.5 15.8 17.6 15.2 14.8 11.9

n=18

xy=4071.71

18.4 17.1 16.7 16.5 15.1 15.1 18.3 16.7 16.6 15.9 15.1 14.5

x=270.1 x=4149.39

2 y=265 y=3996.14

2

分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下

1 n n 1

SP xiyi xi yi 4071.71 270.1 265 95.237778

n i 1 i 1 18i 1

1 n 12

SSx xi xi 4149.39 270.12 96.3894445

n i 1 18i 11 n 12

SSy yi yi 3996.14 2652 94.7511112

n i 1 18i 1

回归参数估计如下

n

2

n

2

n

SP 95.237778 0.988051943 b

SSx96.3894445

1 265 95.237778 270.1 0.104046111 a

1896.389444518

故线性回归方程为

0.104046111

0.988051943x bx ay

图9.10-2 试验点的线性拟合

〖解(3)〗

为区别计,样本数据采用 x,y 表示,预测数据采用 x0,y0 表示。则问题“求x 14.0

时观察值y的置信水平为0.95的预测区间”指“x0 14.0处y0的置信水平为0.95的置信

0之差遵从下面的正态分布 区间”。响应y0 a bx0 与其估计y

2 2 x 1 0

0 N 0, 1 y0 y

nSSx t dfE 于是,x0 14.0处y0的置信水平为0.95的置信区间为

y 0 t

dfE

0.104046111 0.988051943 14.0 13.72868109 bx 0 ay0

95.2377782

SSE SSy SPSSx 94.7511112 0.651239525

96.3894445

2

MSE

SSE0.651239525

0.04070247 n 218 2

t 2

dfE t0.025

16 2.1199 0.208304331 0.441584351

y 0 t

dfE 13.72868109 0.441584351

【习题9.11】蟋蟀用一个翅膀在另一个翅膀上快速地滑动,从而发出吱吱喳喳的叫声。生物学家知到叫声的频率x(叫声数/秒)与气温y具有线性关系。下表列出了15对频率与气温的对应观察结果:

频率x(1/s)

气温y(℃)

频率x(1/s) 气温y(℃)

15.4 20.8

16.2 28.5

15.0 26.4

17.2 28.1

16.0 27.0

17.0 28.6

14.4 24.6

20.0 31.4

16.0 22.0

19.8 34.1

18.4 29.1

17.1 27.0

15.5 24.0

14.7 20.9

17.1 27.8

试求y关于x的线性回归方程。 〖解〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。

图9.11-1 试验点的线性相关趋势

分别计算x、y的样本和、样本平方和及它们的乘积和如下表。

x

20.0 16.0 19.8 18.4 17.1 15.5 14.7 17.1 15.4 16.2 15.0 17.2 16.0 17.0 14.4

样本数据预处理表

y

31.4 22.0 34.1 29.1 27.0 24.0 20.9 27.8 20.8 28.5 26.4 28.1 27.0 28.6 24.6

n=15

xy=6740.71

x=249.8 x=4200.56

2 y=400.3 y=10877.81

2

分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下

1 n n 1

SP xiyi xi yi 6740.71 249.8 400.3 74.38067

n i 1 i 1 15i 1

n

1 n 12

SSx xi xi 4200.56 249.82 40.55733

n i 1 15i 11 n 12

SSy yi yi 10877.81 400.32 195.13733

n i 1 15i 1

回归参数估计如下

n

2

n

2

SP 74.38067 1.83396 b

SSx40.55733

1 400.3 74.38067 249.8 3.85494 a

1540.5573315

故线性回归方程为

3.85494

1.83396x bx ay

图9.11-2 试验点的线性拟合

【习题9.12】下面列出了自1952年~2004年各届奥林匹克运动会男子10000米赛跑的冠军的成绩(时间以min计):

年份(x) 1952

成绩(y)

年份(x) 成绩(y)

1980 27.7

1984 27.8

1988 27.4

1992 27.8

1996 27.1

2000 27.3

2004 27.1

29.3

1956 28.8

1960 28.5

1964 28.4

1968 29.4

1972 27.6

1976 27.7

。 bx a(1) 求y关于x的线性回归方程y

(2) 检验假设H0:b 0,H1:b 0,取显著性水平 0.05。 (3) 求2008年冠军成绩的预测值。 〖解(1)〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性

相关趋势。

图9.12-1 试验点的线性相关趋势

分别计算x、y的样本和、样本平方和及它们的乘积和如下表。

x

1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004

样本数据预处理表

y

29.3 28.8 28.5 28.4 29.4 27.6 27.7 27.7 27.8 27.4 27.8 27.1 27.3 27.1

n=14

xy=775035.6

x=27692 x=54778416

2 y=391.9 y=10977.99

2

分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下

1 n n 1

SP xiyi xi yi 775035.6 27692 391.9 142.6

n i 1 i 1 14i 1

1 n 12

SSx xi xi 54778416 276922 3640

n i 1 14i 11 n 1

SSy y yi 10977.99 391.92 7.589286

n i 1 14i 1

2in

2

n

2

n

回归参数估计如下

SP 142.6 0.0391758 b

SSx3640

1 391.9 142.6 27692 105.4826374 a

14364014

故线性回归方程为

105.4826374

0.0391758x bx ay

图9.12-2 试验点的线性拟合

〖解(2)〗检验假设H0:b 0,H1:b 0,取显著性水平 0.05

检验模型的显著性等价于检验下面的假设

H0:b 0H1:b 0

一元线性回归可采用t检验法,但此处拟采用F检验法,故计算各个平方和并建立方差分析表如下

SST SSy 7.589286

SP2142.62SSR 5.586473

SSx3640

SSE SSy SP2SSx 7.589286 5.586473 2.002813

方差分析表

方差来源 模型

误差 总和

平方和 5.586473 2.002813 7.589286

自由度 1 12 13

均方 5.586473 0.166901

F值

33.4718

F0.05 1,12

4.75

因为MSRMSE 33.4718 4.75,故0.05水平上拒绝H0,即确认回归显著。

〖解(3)〗

由回归方程预测2008年冠军的成绩如下

105.4826374 0.0391758 2008 26.8176 min 0 a bxy0

结论:2008年冠军的预测成绩为26.82min。

【习题9.13】以x和y分别表示人的脚长(英寸,1inch=2.54cm)与手长(英寸),下面列出了15名女子的脚的长度x与手的长度y的样本值:

脚长x 9.00 8.50 9.25 9.75 9.00

手长y

脚长x 手长y

9.25 7.00

9.50 7.00

9.25 7.00

10.00 10.00 7.50

7.25

9.75 7.25

9.50 7.25

6.50

6.25

7.25

7.00

6.75

10.00 7.00

9.50 6.50

9.00 7.00

。 bx a(1) 求y关于x的线性回归方程y

(2) 求

b的置信水平为0.95的置信区间。

bx a〖解(1)〗求y关于x的线性回归方程y

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x之间具有较弱的线性相关趋势。

图9.13-1 试验点的线性相关趋势

分别计算x、y的样本和、样本平方和及它们的乘积和如下表。

x

9.00 8.50 9.25 9.75 9.00 10.00 9.50

样本数据预处理表

y

6.50 6.25 7.25 7.00 6.75 7.00 6.50

n=15 xy=985.5

9.00 9.25 9.50 9.25 10.00 10.00 9.75 9.50 7.00 7.00 7.00 7.00 7.50 7.25 7.25 7.25

x=141.25 x=1332.8125

2 y=104.5 y=729.625

2

分别计算xy的校正叉积和SP、x的校正平方和SSx、y的校正平方和SSy如下

1 n n 1

SP xiyi xi yi 985.5 141.25 104.5 1.4583333

n i 1 i 1 15i 1

1 n 1

SSx x xi 1332.8125 141.252 2.7083333

n i 1 15i 1

2in

2

n

1 n 12

SSy yi yi 729.625 104.52 1.6083333

n i 1 15i 1

回归参数估计如下

n

2

SP 1.4583333 0.53846 b

SSx2.7083333

1 104.5 1.4583333 141.25 1.89615 a

152.708333315

故线性回归方程为

1.89615

0.53846x bx ay

图9.13-2 试验点的线性拟合

〖解(2)〗求b的置信水平为0.95的置信区间

及其变换遵从下面的分布 回归模型中假定误差服从均值为0的正态分布,则统计量b

2

Nb,b

SSx

t dfE

计算误差平方和与误差均方如下

SP21.45833332

SSE SSy 1.6083333 0.8230769

SSx2.7083333

MSE

SSE0.8230769

0.0633136 n 215 2

故b的置信水平为0.95的置信区间为:

b t(df 0.53846 t 2E0.025

0.53846 2.1604 0.53846 0.33032 0.20814,0.86878

【习题9.14】槲寄生是一种寄生在大树上部树枝上的寄生植物。它喜欢寄生在年轻的大树上。下面给出一定条件下完成的试验中采集的数据。

大树的年龄x 每株大树上槲

寄生的株数y

3 28 33 22

4 10 36 24

9 15 22 10

15 6 14 9

40 1 1

(1)作出(xi,yi)的散点图。

(2)令zi lnyi,作出(xi,zi)的散点图。 (3)以模型y ae

bx

, ~N(0, 2)拟合数据,其中a

,b, 2与x无关,试求曲线回归方

ebx。 a程y

〖解(1)〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x具有指数相关的趋势。

图9.14-1 原始数据试验点变量相关的动态特征

〖解(2)〗

采用MATLAB编程绘(xi,lnyi)的散点图。由图可见,变量lny与x之间具有线性相关的趋势。

图9.14-2 对数变换后试验点变量相关的动态特征

〖解(3)〗

设 x,y 表原始数据, X,Y 表变换后的数据。由于模型y ae

bx

可变换为线性模型

Y lny

y aebx X x

Y X lna lny lna bx

b

故可采用线性回归实现模型y ae

bx

对试验数据的拟合,即求回归函数y ae的最

bx

。 ae小二乘估计y

bx

X,先分别求X、Y的样本和、样本平方和 为求Y关于X的线性回归方程Y

及它们的乘积和,详见下表。

样本数据预处理表

x

3

4 9 15 40 3 4 9 15 40 3

y

28 10 15 6 1 33 36 22 14 1 22

X

3 4 9 15 40 3 4 9 15 40 3

Y

3.3322 2.3026 2.7081 1.7918 0 3.4965 3.5835 3.0910 2.6391 0 3.0910

数据预处理

4 9 15

2

24 10 9 4 9 15

2

3.1781 2.3026 2.1972

X=173 X=4193

n

Y=33.7136315 Y=98.3200266

n=14

XY=238.3516154

分别计算XY的校正叉积和、X的校正平方和、Y的校正平方和SP,SSX,SSY如下

1 n n

SP XiYi Xi Yi

n i 1 i 1 i 1

238.3516154

n

1

173 33.7136315 178.252545314

2

1 n1 2

SSX Xi Xi 4193 1732 2055.214286

n i 1 14i 1

1 n 1

SSY Yi Yi 98.3200266 33.71363152 17.1336731

n i 1 14i 1

2n

2

回归参数估计如下

SP 178.2525453 0.0867319

SSx2055.214286

1 33.7136315 178.2525453 173 3.4798744

142055.21428614

故线性回归方程为

X 3.4798744 0.0867319X Y

还原为原非线性回归方程,则得

y eY x X bx x 0.0867319x y X Y ae ee 32.4556454e a e b

32.4556454e 0.0867319x拟合数据的效果 图9.14-3 非线性回归方程y

【习题9.15】一种合金在某种添加剂的不同浓度之下,各做三次试验,得数据如下:

浓度x 10.0 15.0 20.0 25.0 30.0

抗压强度y

(1)做散点图。

(2)以模型y b0 b1x b2x , ~N(0, )拟合数据,其中b0,b1,b2, 与x无关,

2

25.2

27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8

22

b x b

x。 b求回归方程y012

2

〖解(1)〗

采用MATLAB编程绘(xi,yi)的散点图。由图可见,变量y与x具有非线性相关趋势。

图9.10-1 原始数据试验点变量相关的动态特征

〖解(2)〗

设x1 x和x2 x2,则非线性回归模型y b0 b1x b2x2 可变换为线性回归模型

y b0 b1x1 b2x2 。多元线性回归的矩阵形式为

本文来源:https://www.bwwdw.com/article/cr7i.html

Top