实验报告(三)-2

更新时间:2023-09-27 20:57:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

浙江大学城市学院 实 验 报 告 纸

学生姓名:董媛 学号:31405667

一、实验项目名称:实验报告(三) 二、实验目的和要求

(一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测;

(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归;

三、实验内容

1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号 产量(台) 生产费用(万元) 企业编号 产量(台) 生产费用(万元) 1 2 3 4 5 6 40 42 50 55 65 78 130 150 155 140 150 154 7 8 9 10 11 12 84 100 116 125 130 140 165 170 167 180 175 185 (1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。

1

浙江大学城市学院 实 验 报 告 纸

(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(并说明二者之间的关系强度。

相关性

),

产量(台)

Pearson 相关性 显著性(双侧) N

生产费用(万元)

Pearson 相关性 显著性(双侧) N

在 .01 水平(双侧)上显著相关。

产量(台) 生产费用(万元)

1

.920** .000

12 .920** .000 12

12 1

12

2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:

地区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22460 11226 34547 4851 5444 2662 4549 人均消费水平(元) 7326 4490 11546 2396 2208 1608 2035 (1) 绘制散点图,并计算相关系数,说明二者之间的关系。

相关性

2

浙江大学城市学院 实 验 报 告 纸

人均GDP(元)

Pearson 相关性 显著性(双侧) N

人均消费水平(元)

Pearson 相关性 显著性(双侧) N

在 .01 水平(双侧)上显著相关。

人均消费水平

人均GDP(元)

1

(元)

.998** .000

7 .998** .000 7

7 1

7

(2) 人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并

解释回归系数的实际意义。

设人均GDP作自变量X,人均消费水平作因变量Y,建立一元线性回归模型。

Y=?0??1X??

模型汇总 标准 估计的误模型 1 R 0.998a R 方 0.996 调整 R 方 0.996 差 247.303 a. 预测变量: (常量), 人均GDP(元)。 Anovab 模型 1 回归 残差 总计 平方和 81444968.680 305795.034 81750763.714 df 1 5 6 均方 81444968.680 61159.007 F 1331.692 Sig. .000a a. 预测变量: (常量), 人均GDP(元)。 b. 因变量: 人均消费水平(元) 系数a 非标准化系数 模型 1 (常量) B 734.693 标准 误差 139.540 标准系数 试用版 t 5.265 Sig. .003 3

浙江大学城市学院 实 验 报 告 纸

人均GDP(元) a. 因变量: 人均消费水平(元) 0.309 0.008 0.998 36.492 .000 所以Y=734.693+0.309X,回归系数代表自变量对因变量的影响大小。 (3) 计算判定系数和估计标准误差,并解释其意义。

回归系数是0.996,估计标准误差是247.303,回归系数代表了观测点靠近回归曲线的程度,而估计标准误差显示了误差的大小程度。

(4) 检验回归方程线性关系的显著性(

统计量F的值是1331.692,显著性概率是0.000,因此,线性关系显著 (5) 如果某地区的人均GDP为5000元,预测其人均消费水平。

Y=5000*0.309+734.693=2279.693

(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:

航空公司编号 1 2 3 4 5 6 7 8 9 10 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5 投诉次数(次) 21 58 85 68 74 93 72 122 18 125 (1) 用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。

模型汇总 标准 估计的误模型 1 R 0.869a R 方 0.755 调整 R 方 0.724 差 18.887 a. 预测变量: (常量), 航班正点率(%)。 Anovab 模型 平方和 df 均方 F Sig. 4

浙江大学城市学院 实 验 报 告 纸

1 回归 残差 总计 8772.584 2853.816 11626.400 1 8 9 8772.584 356.727 24.592 .001a a. 预测变量: (常量), 航班正点率(%)。 b. 因变量: 投诉次数(次) 系数a 非标准化系数 模型 1 (常量) 航班正点率(%) a. 因变量: 投诉次数(次) B 430.189 -4.701 标准 误差 72.155 0.948 标准系数 试用版 t 5.962 -.869 -4.959 Sig. .000 .001 用航班正点率作自变量X,顾客投诉次数作因变量Y Y=430.189-4.701X

(2) 检验回归系数的显著性(

)。

回归系数的显著性检验t值为-4.959.概率为0.001,说明航班正点率对顾客投诉次数影响显著。

(3) 如果航班正点率为80%,估计顾客的投诉次数。

Y=430.189-4.701*80%=426.4282

4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

方差分析表 变差来源 回归 残差 总计 参数估计表 Intercept X Variable 1 Coefficients 363.6891 1.420211 标准误差 62.45529 0.071091 t Stat 5.823191 19.97749 P-value 0.000168 2.17E-09 df 11 SS 40158.07 1642866.67 MS — F — — Significance F 2.17E-09 — — (1) 完成上面的方差分析表。 变差来源 回归 残差 总计

df 1 SS 1602708.6 MS 1602708.6 4015.807 — 5

F 399 — — Significance F 2.17E-09 — — 10 40158.07 11 1642866.67

浙江大学城市学院 实 验 报 告 纸

(2) 汽车销售量的变差中有多少是由于广告费用的变动引起的? 有95.76%是由于广告费用的变动引起的

(3) 销售量与广告费用之间的相关系数是多少?

回归系数等于1.420211

(4)写出估计的回归方程并解释回归系数的实际意义。

Y=363.6891+1.420211X

(5)检验线性关系的显著性(a=0.05)。

显著

5. 随机抽取7家超市,得到其广告费支出和销售额数据如下 超市 A B C D E F G 广告费支出/万元 1 2 4 6 10 14 20 销售额/万元 19 32 44 40 52 53 54 (1) 用广告费支出作自变量 ,销售额为因变量 ,求出估计的回归方程。

模型汇总 标准 估计的误模型 1 R 0.831a R 方 0.690 调整 R 方 0.628 差 7.878 a. 预测变量: (常量), 广告费支出/万元。 Anovab 模型 1 回归 残差 总计 平方和 691.723 310.277 1002.000 df 1 5 6 均方 691.723 62.055 F 11.147 Sig. .021a a. 预测变量: (常量), 广告费支出/万元。 b. 因变量: 销售额/万元

6

浙江大学城市学院 实 验 报 告 纸

系数a 非标准化系数 模型 1 (常量) 广告费支出/万元 a. 因变量: 销售额/万元 B 29.399 1.547 标准 误差 4.807 .463 标准系数 试用版 t 6.116 .831 3.339 Sig. .002 .021 用广告费支出作自变量 ,销售额为因变量 ,求出估计的回方程。Y=29.399+1.547X

(2) 检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。 F检验的P值为0.021,小于0.025,则可说明关系显著 (3) 绘制关于 的残差图,你觉得关于误差项 的假定被满足了吗?

满足

(4) 你是选用这个模型,还是另寻找一个该更好的模型? 选用这个模型

6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据

月销售收入y(万元) 96 90 95 92 95 电视广告费用 (万元) 报纸广告费用1.5 2.0 1.5 2.5 3.3 (万元) 5.0 2.0 4.0 2.5 3.0 7

浙江大学城市学院 实 验 报 告 纸

94 94 94 3.5 2.5 3.0 2.3 4.2 2.5 (1) 用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。

模型汇总 标准 估计的误模型 1 R 0.808a R 方 0.653 调整 R 方 0.595 差 1.21518 a. 预测变量: (常量), VAR00002。 Anovab 模型 1 回归 残差 总计 平方和 16.640 8.860 25.500 df 1 6 7 均方 16.640 1.477 F 11.269 Sig. .015a a. 预测变量: (常量), VAR00002。 b. 因变量: VAR00001 系数a 非标准化系数 模型 1 (常量) VAR00002 a. 因变量: VAR00001 B 88.638 1.604 标准 误差 1.582 0.478 标准系数 试用版 t 56.016 3.357 Sig. .000 .015 0.808 Y=88.638+1.604X1 (2) 用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并

说明回归系数的意义。

模型汇总 标准 估计的误模型 1 R 0.959a R 方 0.919 调整 R 方 0.887 差 .64259 a. 预测变量: (常量), VAR00003, VAR00002。

Anovab

8

浙江大学城市学院 实 验 报 告 纸

模型 1 回归 残差 总计 平方和 23.435 2.065 25.500 df 2 5 7 均方 11.718 .413 F 28.378 Sig. .002a a. 预测变量: (常量), VAR00003, VAR00002。 b. 因变量: VAR00001 系数a 非标准化系数 模型 1 (常量) VAR00002 VAR00003 a. 因变量: VAR00001 B 83.230 2.290 1.301 标准 误差 1.574 .304 .321 标准系数 试用版 t 52.882 7.532 4.057 Sig. .000 .001 .010 1.153 .621 Y=82.23+2.29X1+1.301X2 (3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。 不相同

(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。

R方代表了回归平方占据总平方和的比例,R方越大代表回归曲线越准确。

7. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下

收获量y (kg) 2250 3450 4500 6750 7200 7500 8250 降 雨 量x1 (mm) 25 33 45 105 110 115 120 温 度x2 (6 8 10 13 14 16 17 ) 建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=0.05),你认为模型中是否存在多重共线性?

模型汇总

标准 估计的误

模型 1

R .996a

R 方

.991

调整 R 方

.987

差 261.43103

9

浙江大学城市学院 实 验 报 告 纸

模型汇总 标准 估计的误模型 1 R .996a R 方 .991 调整 R 方 .987 差 261.43103 a. 预测变量: (常量), VAR00003, VAR00002。 Anovab 模型 1 回归 残差 总计 平方和 31226615.257 273384.743 31500000.000 df 2 4 6 均方 15613307.629 68346.186 F 228.444 Sig. .000a a. 预测变量: (常量), VAR00003, VAR00002。 b. 因变量: VAR00001 系数a 非标准化系数 模型 1 (常量) VAR00002 VAR00003 a. 因变量: VAR00001 B -.591 22.386 327.672 标准 误差 505.004 9.601 98.798 标准系数 试用版 t -.001 .415 .590 2.332 3.317 Sig. .999 .080 .029 Y=-0.591+22.386X1+327.672 有显著线性关系,其中降雨量对收获量影响不显著,但是温度却显著。

8. 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1 )、房产的评估价值(x2 )和使用面积(x3 )建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据如下: 房地产编号 销售价格y(元/㎡) 地产估价1 2 3 4 5 6 6890 4850 5550 6200 11650 4500 (万元) 房产估价(万元) 使用面积(㎡) 596 900 950 1000 1800 850 4497 2780 3144 3959 7283 2732 18730 9280 11260 12650 22140 9120 10

本文来源:https://www.bwwdw.com/article/7d1d.html

Top