应用回归分析试题(2套)

更新时间:2024-05-02 10:16:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

应用回归分析试题(一)

一、选择题.(每题3分,共15分)

题号 答案 1 2 3 4 5

1、对于一元线性回归yi??0??1xi??i(i?1,2,...,n),E(?i)?0,var(?i)??2,

cov(?i,?j)?0(i?j),下列说法错误的是

?,?? 都是无偏估计; (A)?0,?1的最小二乘估计?01?,??对y,y,...,y是线性的; (B)?0,?1的最小二乘估计?n1201?,??之间是相关的; (C)?0,?1的最小二乘估计?01(D)若误差服从正态分布,?0,?1的最小二乘估计和极大似然估计是不一样的.

2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化 (A)

1y;(B) y;(C) ln(y?1);(D)lny.

3、下列说法错误的是

(A)强影响点不一定是异常值;

(B)在多元回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的; (C)一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关.

4、下面给出了4个残差图,哪个图形表示误差序列是自相关的

e102345678 (A)

(B) x

(C) (D)

5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的

(A) (B)

(C) (D)

二、填空题(每空2分,共20分)

221、考虑模型y?X???,var(?)??In,其中X:n?p?,秩为p?,??0不一定

??__________________, var(??)?___________,若?服从正态分布,则 已知,则??(n?p?)?2?2?2是?2的无偏估计. ?___________,其中?2、下表给出了四变量模型的回归结果:

来源 回归 残差 总的 平方和 65965 --- 66042 自由度 --- --- 14 均方 --- --- 则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________. 3、已知因变量y与自变量x1,x2,x3,x4,下表给出了所有可能回归模型的AIC值,则最优子集是_____________________.

模型中的变量 AIC 202.55 2.68 142.49 62.44 3.04 198.10 315.16 模型中的变量 AIC 3.50 5.00 7.34 138.23 2.12 5.50 138.73 x1 x1,x2x2 x2,x3 x1,x2,x3 x1,x3 x3 ,x4 x1,x2,x3,x4 x2,x3,x4 x2,x4 x1,x2,x4 x1,x4 x4 x1,x34、在诊断自相关现象时,若DW?0.66,则误差序列的自相关系数?的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法. 5、设因变量y与自变量x的观察值分别为y1,y2,...,yn和x1,x2,...,xn,则以x*为折点的折线模型可表示为_____________________.

三、(共45分)研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的线性回归关系.观察数据及残差值ei、学生化残差SREi、删除学生化残差SRE(i)、库克距离Di、杠杆值chii见表一

表一

编号 1 2 3 4 y x1 70 75 65 74 x2 35 40 40 42 x3 ei 1.0 -15.474 2.4 12.825 2.0 5.344 3.0 -0.091 SREi -0.894 0.628 0.265 -0.004 SRE(i) Di 0.166 0.031 0.006 1.168E-6 chii 0.454 0.240 0.261 0.199 160 260 210 265 -0.876 0.593 0.243 -0.004 5 6 7 8 9 10 240 220 275 160 275 250 72 68 78 66 70 65 38 45 42 36 44 42 1.2 33.225 1.5 -25.198 4.0 -17.554 2.0 -20.007 3.2 8.234 3.0 18.695 1.754 -2.116 -1.173 -1.163 0.409 1.065 2.294 -3.832 -1.220 -1.206 0.379 1.079 0.409 3.216 0.501 0.289 0.015 0.222 0.347 0.742 0.593 0.461 0.264 0.439

表二 参数估计表

变量 Intercept 系数 -348.280 3.754 7.101 12.447 标准误 176.459 1.933 2.880 10.569 x1 x2 x3 总平方和SST=16953 残差平方和SSE=3297

已知t0.025(6)?2.447,t0.025(7)?2.365,F0.05(3,6)?4.76,F0.05(4,7)?4.12,根据上述结果,解答如下问题:

1、计算误差方差?2的无偏估计及判定系数R2.(8分)

2、对x1,x2,x3的回归系数进行显著性检验.(显著性水平??0.05)(12分)

3、对回归方程进行显著性检验.(显著性水平??0.05)(8分)

4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)

5、写出y关于x1,x2,x3的回归方程,并结合实际对问题作一些基本分析(7分)

四、(共8分)某种合金中的主要成分为金属A与金属B,研究者经过13次试验,发现这两种金属成分之和x与膨胀系数y之间有一定的数量关系,但对这两种金属成分之和x是否对膨胀系数y有二次效应没有把握,经计算得y与x的回归的残差平方和为3.7,y与x、

x的回归的残差平方和为0.252,试在0.05的显著性水平下检验x对y是否有二次效应?

2(参考数据F0.05(1,10)?4.96,F0.05(2,10)?4.1)

五、(共12分)(1)简单描述一下自变量x1,x2,...,xp之间存在多重共线性的定义;(2分) (2)多重共线性的诊断方法主要有哪两种?(4分) (3)消除多重共线性的方法主要有哪几种?(6分)

应用回归分析试题(二)

一、选择题

1. 某同学由x与y之间的一组数据求得两个变量间的线性回归方程为y?bx?a,已知:数据x 的平均值为2,数据y的平均值为3,则 ( A )

A.回归直线必过点(2,3) B.回归直线一定不过点(2,3) C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方

2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y与X之间的回归直线方程为( A ) ??x?1 B.y??x?2 C.y??2x?1 D.y??x?1 A.y3. 在对两个变量x,y进行线性回归分析时,有下列步骤:

①对所求出的回归直线方程作出解释; ②收集数据(xi、yi),i?1,2,…,n;

③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图

如果根据可行性要求能够作出变量x,y具有线性相关结论,则在下列操作中正确的是( D ) A.①②⑤③④ B.③②④⑤① C.②④③①⑤ D.②⑤④③①

4. 下列说法中正确的是(B )

A.任何两个变量都具有相关关系 B.人的知识与其年龄具有相关关系

C.散点图中的各点是分散的没有规律 D.根据散点图求得的回归直线方程都是有意义的

5. 给出下列结论:

(1)在回归分析中,可用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;

(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有(B )个.

A.1 B.2 C.3 D.4 6. 已知直线回归方程为y?2?1.5x,则变量x增加一个单位时(C ) A.y平均增加1.5个单位 B.y平均增加2个单位C.y平均减少1.5个单位

7. 下面的各图中,散点图与相关系数r不符合的是(B )

D.y平均减少2个单位

8. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y??7.19x?73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是( D )

A.身高一定是145.83cm B.身高超过146.00cm C.身高低于145.00cm D.身高在145.83cm左右

9. 在画两个变量的散点图时,下面哪个叙述是正确的( B ) (A)预报变量在x轴上,解释变量在y轴上 (B)解释变量在x轴上,预报变量在y轴上 (C)可以选择两个变量中任意一个变量在x轴上 (D)可以选择两个变量中任意一个变量在y轴上

10. 两个变量y与x的回归模型中,通常用R来刻画回归的效果,则正确的叙述是( D ) A. R越小,残差平方和小 B. R越大,残差平方和大 C. R于残差平方和无关 D. R越小,残差平方和大

11. 两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R如下 ,其中拟合效果最好的模型是( A )

A.模型1的相关指数R为0.98 B.模型2的相关指数R为0.80 C.模型3的相关指数R为0.50 D.模型4的相关指数R为0.25

12. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( B ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R2

222222222213.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y ??60?90x,下列判断正确的是(C )A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元

14. 下列结论正确的是(C )

①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①②

15. 已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( C )

y?1.23x?4 B.?y?1.23x?5 C.?y?1.23x?0.08 D.?y?0.08x?1.23 A.?

B.①②③ C.①②④ D.①②③④

二、填空题

16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R的值分别约为0.96和0.85,则拟合效果好的模型是 甲 .

17. 在回归分析中残差的计算公式为 列联表、三维柱形图、二维条形图 . 18. 线性回归模型y?bx?a?e(a和b为模型的未知参数)中,e称为 随机误差 .

19. 若一组观测值(x1,y1)(x2,y2)…(xn,yn)之间满足yi=bxi+a+ei (i=1、2.…n)若ei恒为0,则R2为___ ei

2恒为0,说明随机误差对yi贡献为0.

三、解答题

20. 调查某市出租车使用年限x和该年支出维修费用y(万元),得到数据如下:

使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 (1) 求线性回归方程;

?n(2)由(1)中结论预测第10年所支出的维修费用.(??(xi?x)?(yi?y)??b?i?1)

?n??(x?x)2i?i?1??a?y?bx20. 解析: (1)列表如下: i 1 2 3 4 5 xi 2 3 4 5 6 yi 22 38 55 65 70 xiyi 44 114 220 325 420 x2i 4 9 16 25 36 55x?4, y?5, ?x2i?90, ?xiyi?112.3 i?1i?1

5于是?xiyi?5xyb?i?1?5?4?5

5?112.3?x2290?5?42?1.23,i?5xi?1 a?y?bx?5?1.23?4?0.08 ∴线性回归方程为:y^?bx?a?1.23x?0.08 (2)当x=10y^?1.23?10?0.08?12.38(万元)

即估计使用10年时维修费用是1238万元 回归方程为:y?1.23x?0.08(2) 预计第10年需要支出维修费用12.38 万元.

21. 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:

(1)画出数据对应的散点图;

(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m2时的销售价格. (4)求第2个点的残差。

21. 解析:(1)数据对应的散点图如图所示:

(2)x?15i5

x?5i?1?109,lxx??(xi?1i2?x)?1570,

5y?23.2,lxy??(xi?1i?x)(yi?y)?308

设所求回归直线方程为y?bx?a,

lxylxx3081570?则b???0.1962

3081570a?y?bx?23.2?109??1.8166

故所求回归直线方程为y?0.1962x?1.8166

(3)据(2),当x?150m2时,销售价格的估计值为:

?y?0.1962?150?1.8166?31.2466(万元)

?必看经典例题

1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:H0:?1?0。 (1)线性关系检验的统计量F值是多少? (2)给定显著性水平a=0.05,Fa是多少? (3)是拒绝原假设还是不拒绝原假设?

(4)假定x与y之间是负相关,计算相关系数r。

(5)检验x与y之间的线性关系是否显著?

解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;

SSR60kSSEn?k?1 因此:F=

=1=27 4018(2)F??1,18?=F0.05?1,18?=4.41 (3)拒绝原假设,线性关系显著。 (4)r=SSRSSR?SSE=0.6=0.7746,由于是负相关,因此r=-0.7746

(5)从F检验看线性关系显著。

2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

方差分析表 变差来源 回归 残差 总计 Intercept XVariable1 参数估计表 Coefficients 标准误差 363.6891 1.420211 62.45529 0.071091 tStat 5.823191 19.97749 P—value 0.000168 2.17E—09 df 11 SS 40158.07 1642866.67 MS — F — — SignificanceF 2.17E—09 — — 要求: (1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(a=0.05)。

解:

变差来源 回归 df 1 SS 1602708.6 MS 1602708.6 F 399.1000065 SignificanceF 2.17E—09

本文来源:https://www.bwwdw.com/article/z34g.html

Top