统计学期末大作业题目及答案

更新时间:2023-10-27 07:05:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学实践作业

参数估计练习题

1. 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据见book3.1表。

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 平均 3.316666667 标准误差 0.268224616 中位数 3.25 众数 5.4 标准差 1.609347694 方差 2.59 峰度 -0.887704917 偏度 0.211008874 区域 5.9 最小值 0.5 最大值 6.4 求和 119.4 观测数 36 最大(1) 6.4 最小(1) 0.5 置信度(90.0%) 0.453184918

置信区间 平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数 最大(1) 最小(1)

2.863481748 3.769851585

3.316666667 0.268224616 3.25 5.4

1.609347694 2.59

-0.887704917 0.211008874 5.9 0.5 6.4 119.4 36 6.4 0.5

置信度(95.0%)

0.544524915

置信区间 2.772141751 3.861191582

平均 3.316666667 标准误差 0.268224616 中位数 3.25 众数 5.4 标准差 1.609347694 方差 2.59 峰度 -0.887704917 偏度 0.211008874 区域 5.9 最小值 0.5 最大值 6.4 求和 119.4 观测数 36 最大(1) 6.4 最小(1) 0.5 置信度(99.0%) 0.730591706 置信区间 2.58607496 4.047258373

2. 某机器生产的袋茶重量(g)的数据见book3.2。构造其平均重量的置信水

平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值

平为90%、95%和99%的置信区间。 3.32952381

0.05272334

3.25 3.2

0.241608696 0.058374762 0.413855703 0.776971476 0.95 2.95 3.9

求和 69.92 观测数 21 最大(1) 3.9 最小(1) 2.95 置信度(90.0%) 0.090932905 置信区间 3.238590905 3.420456714

平均 3.32952381 标准误差 0.05272334 中位数 3.25 众数 3.2 标准差 0.241608696 方差 0.058374762 峰度 0.413855703 偏度 0.776971476 区域 0.95 最小值 2.95 最大值 3.9 求和 69.92 观测数 21 最大(1) 3.9 最小(1) 2.95 置信度(95.0%) 0.109978959 置信区间 3.21954485 3.439502769

平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值

3.32952381 0.05272334 3.25 3.2

0.241608696 0.058374762 0.413855703 0.776971476 0.95 2.95 3.9

求和 69.92 观测数 21 最大(1) 3.9 最小(1) 2.95 置信度(99.0%) 0.150015812 置信区间 3.179507997 3.479539622

3. 某机器生产的袋茶重量(g)的数据见book3.3。构造其平均重量的置信水平为90%、95%和99%的置信区间。 平均 3.29 标准误差 0.014798365 中位数 3.29 众数 3.3 标准差 0.087548306 方差 0.007664706 峰度 1.781851265 偏度 0.003904912 区域 0.47 最小值 3.05 最大值 3.52 求和 115.15 观测数 35 最大(1) 3.52 最小(1) 3.05 置信度(90.0%) 0.025022913 置信区间 3.264977087 3.315022913

平均 标准误差 中位数 众数 标准差 方差 峰度

3.29 0.014798365 3.29 3.3

0.087548306 0.007664706 1.781851265

偏度 0.003904912 区域 0.47 最小值 3.05 最大值 3.52 求和 115.15 观测数 35 最大(1) 3.52 最小(1) 3.05 置信度(95.0%) 0.030073895 置信区间 3.259926105 3.320073895

平均 3.29 标准误差 0.014798365 中位数 3.29 众数 3.3 标准差 0.087548306 方差 0.007664706 峰度 1.781851265 偏度 0.003904912 区域 0.47 最小值 3.05 最大值 3.52 求和 115.15 观测数 35 最大(1) 3.52 最小(1) 3.05 置信度(99.0%) 0.040375775 置信区间 3.249624225 3.330375775

资料整理练习题

1. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的

一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见表book1.1。要求:

(1)制作一张频数分布表;

(2)绘制统计图,反映评价等级的分布。

计数项:xt xt 汇总 A 14 B 21 C 32 D 18 E 15 (空白) 总计 100

2. 某行业管理局所属40个企业2002年的产品销售收入数据(单位:

万元)见book1.2。要求:

(1)根据销售收入在125万元以上为先进企业,115~125万元为

良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算出累积频数和累积频率;

-104 累计频数 累计频率 9 22.50%

105-114 9 115-124 11 125+ 11

45.00% 72.50% 100.00%

(2)绘制统计图,反映分布情况。

累计频数121086420落后一般良好先进累计频数

3. 北方某城市1月~2月份各天气温的记录数据见book1.3。 (1)对上面的数据进行适当的分组。

(2)绘制统计图,说明该城市气温分布的特点.

接收 -10 -5 0 5 10 其他

频率 26 15 15 5 4 0

累积 % 40.00% 63.08% 86.15% 93.85% 100.00% 100.00%

说明:该城市气温在逐步回暖,整体偏冷。

多变量资料整理练习题

下面是有关“北京地区大学生掌上阅读状况调查”的部分题目, (1)性别:1男 2女 (2)学级:

1 大专 2 大一 3大二 4大三 5大四 6研一 7研二 8 博士生 (3)月生活费:

1 600元以下 2 600—1000元 3 1000—1500元 4 1500—2000元 5 2000元以上 (4)手机类型:

1 低端机 2 中端机 3高端机 4智能机 5 其他 (5)运营商:

1 中国移动 2 中国联通 3中国电信 4中国网通 被调查者对这5个题目的回答如数据表book1.8。

1.分析不同性别学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。

2.分析不同学级的学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。

3. 分析不同性别学生选择运营商的情况,要求结合交叉分析表和相

应统计图进行分析。

4.分析不同学级的学生选择运营商的情况,要求结合交叉分析表和相

应统计图进行分析。

求和项:手机类型 q4 性别 q1 1 2 总计 手机类型 q4 1 22 11 33 2 66 92 158 3 156 213 369 4 240 236 476 5 10 15 25 总计 494 567 1061 [1]由题可知,男生选择智能机的比较多,而女生选择高端机的比较多。

3002502001501005001234512

求和项:手机类型 手机类型 q4 q4 学级 1 2 3 4 5 总计

1 3 2 3 3 10 4 6 5 3 6 6 7 1 8 1 总计 33 [2]专的孩子偏爱智能机 大一孩子偏爱智能机 大二孩子偏爱高端机 大三孩子偏爱智能机 大四孩子偏爱高端机 研一孩子偏爱智能机 研二孩子偏爱智能机 博士生只有一人使用低端机 求和项:运营商 运营商 q5 q5 性别 1 q1 1 135 2 150 总计 285 10 16 52 40 14 18 8 158 120100806040200123 54 102 63 114 21 12 369 44 80 88 88 68 60 48 476 5 5 5 10 25 65 153 257 202 209 105 69 1 1061 12345345678 2 66 76 142 3 6 6 4 4 4 总计 205 232 437 [3]男生偏爱中国移动 女生偏爱中国移动

160140120100806040200123412

求和项:运营商 q5 学级 1 2 3 4 5 6 7 8 总计 运营商 q5 1 16 35 76 54 48 35 20 1 285 2 10 28 32 32 34 4 2 142 3 3 3 6 4 4 4 总计 26 63 111 86 89 39 22 1 437 [4]专到博都是选择中国移动的人最多,其次是中国联通,选择电信和网通的用户较少

8070605040302010012345678

1234多元线性回归练习题

1. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近8个月的销售额与广告费用数据见book7.1表。

(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。检验回归方程的线性关系是否显著(? =0.05);检验各回归系数是否显著(? =0.05) 。

SUMMARY OUTPUT

回归统计 Multiple R

0.958663444

R Square

Adjusted R Square 标准误差 观测值

方差分析

Significance

df SS MS F F

回归分析 2 23.43540779 11.7177039 28.37776839 0.001865242 残差 5 2.064592208 0.412918442 总计 7 25.5

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%

Intercept 83.23009169 1.573868952 52.88247894 4.57175E-08 79.18433275 87.27585063 电视广告费用 /万元 2.290183621 0.304064556 7.531899313 0.000653232 1.508560797 3.071806445 报纸广告费用 /万元 1.300989098 0.320701597 4.056696662 0.009760798 0.476599399 2.125378798 SUMMARY OUTPUT 回归统计 Multiple R 0.807807408 R Square 0.652552809 Adjusted R Square 0.594644943 标准误差 1.215175116 观测值 8 方差分析

Significance

df SS MS F F

回归分析 1 16.64009662 16.64009662 11.26881134 0.015288079 残差 6 8.859903382 1.476650564 总计 7 25.5

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%

Intercept 88.63768116 1.582367131 56.01587609 2.174E-09 84.76576828 92.50959404 电视广告费用 /万元 1.603864734 0.47778079 3.356905024 0.015288079 0.434777259 2.772952209 [1]回归方程为:y=1.60x+88.64 [2]回归方程:y=2.29x1+1.30x2+83.23 F值0.001865小于0.05,回归方程的线性关系显著 对于x1的系数:p值0.00065小于0.05,显著

0.9190356

0.88664984 0.642587303 8

对于x2的系数:p值0.009761小于0.05,显著

2. 一家房地产评估公司想对某城市的房地产销售价格y1与地产的评估价值x1、房产的评估价值x2和使用面积x3建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据见book7.2表。

(1)写出估计的多元回归方程。

(2)检验回归方程的线性关系是否显著(? =0.05)。 (3)检验各回归系数是否显著(? =0.05) 。

SUMMARY OUTPUT 回归统计 Multiple R 0.947362461 R Square 0.897495632 Adjusted R Square 0.878276063 标准误差 791.6823283 观测值 20 方差分析

Significance

df SS MS F F 回归分析 3 87803505.46 29267835.15 46.69696966 3.87913E-08 残差 16 10028174.54 626760.909 总计 19 97831680

Coefficients 标准误差 t Stat P-value Lower 95% Intercept 148.700454 574.421324 0.25887001 0.799036421 -1069.018347 0.814738183 0.511988507 1.591321236 0.13109905 -0.270628958 0.820979542 0.211176502 3.887646272 0.001307361 0.373305358 0.135041012 0.065863312 2.050322204 0.057088036 -0.004582972 回归方程:y=0.81x1+0.82x2+0.135x3+148.7 对于回归方程:F值远远小于0.05,所以回归方程式显著 对于x1:0.13大于0.05,不显著 对于x2:0.001小于0.05,显著 对于x3:0.057大于0.05,不显著 所以回归方程为:y+=0.82x2+148.7

3. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据见book7.3表。

(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。

解释回归系数的实际意义。

(2)检验回归方程的线性关系是否显著(? =0.05)。 (3)检验各回归系数是否显著(? =0.05) 。

SUMMARY OUTPUT

回归统计 Multiple R R Square

Adjusted R Square 标准误差 观测值

方差分析

回归分析 残差 总计

Intercept x1

0.995651103 0.991321119 0.986981679 261.4310342 7

Significance

df SS MS F F 2 31226615.26 15613307.63 228.4444623 7.5323E-05 4 273384.7425 68346.18563 6 31500000 Coefficients 标准误差 t Stat P-value Lower 95% 上限 95.0% -0.590996232 505.0042289 -0.00117028 0.99912229 -1402.707516 1401.525523 22.38646129 9.600543531 2.331791031 0.080094808 -4.268920799 49.04184339

601.978727

x2 327.6717128 98.79792462 3.31658498 0.029472413 53.36469864 回归方程为:y=22.39x1+327.67x2-0.59 对于回归方程:F值远远小于0.05,所以回归方程显著 对于回归系数x1:0.08大于0.05,不显著 对于回归系数x2:0.029小于0.05,显著

方差分析练习题

1.从3个总体中各抽取容量不同的样本数据,得到的数据见book5.1表。检验3个总体的均值之间是否有显著差异?(? =0.01) 方差分析:单因素方差分析

SUMMARY

组 列 1

观测数 方差 5 61.5

36.66666

列 2 4 600 150 667 列 3 3 507 169 121 方差分析 差异源 SS df MS F P-value F crit

4.6573990.04087724.25649472

组间 618.9166667 2 309.4583333 666 39 9 组内 598 9 66.44444444 总计 1216.916667 11

4.65739966555184>4.25649472914256

0.040877238761821>0.01,不能拒绝原假设

2. 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见book5.2表。试分析三个企业生产的电池的平均寿命之间有无显著差异? (? =0.05) 方差分析:单因素方差分析 SUMMARY

组 观测数 求和 平均 方差

列 1 5 15 3 2.5 列 2 5 222 44.4 28.3 列 3 5 150 30 10 列 4 5 213 42.6 15.8 方差分析

差异源 SS df MS F P-value F crit

1825.

组间 5475.6 3 2 128.9893993 2.02553E-11 3.238871522 组内 226.4 16 14.15 总计 5702 19 128.989399293286>3.23887152236109 2.02552624576458E-11<0.05

求和 平均 790 158

拒绝原假设,有显著差异

3.将24家生产产品大致相同的企业按资金分为三类,每个公司的每100元销售收入的生产成本(单位:元)如表book5.3,。这些数据能否说明三类公司的市场生产成本有差异?(显著性水平为0.05) 方差分析:单因素方差分析 SUMMARY

组 观测数 求和 平均 方差

列 1 8 569 71.125 8.410714286 列 2 8 595 74.375 18.83928571 列 3 8 641 80.125 21.55357143 方差分析

差异源 SS df MS F P-value F crit

3.466

332.3333166.166660.0007980011

组间 333 2 67 10.21441639 7305 2

16.267857

组内 341.625 21 14

673.9583

总计 333 23 10.214416392243>3.46680011159428 0.000797304599141931<0.05 拒绝原假设

4.某商店采用四种不同的方式推销商品。为检验不同方式推销商品的效果是否有显著差异,随机抽取样本得到表book5.4的数据,请在0.05的显著性水平下做出决策。

方差分析:单因素方差分析 SUMMARY

组 观测数 求和 平均 方差 列 1 5 415 83 20 列 2 5 449 89.8 23.7 列 3 5 374 74.8 27.7 列 4 5 395 79 29

方差分析 差异源 SS df MS F P-value F crit 组间 610.95 3 203.65 8.113545817 0.001644272 3.238871522 组内 401.6 16 25.1 总计 1012.55 19 8.11354581673307>3.23887152236109

0.00164427236100831<0.05

拒绝原假设,不同方式推销商品的效果差异显著

方式一的方差最小,应选方式一

5.五个地区每天发生交通事故的次数如表book5.5,由于是随机抽样,有一些地区的样本容量较多(如南部和西部),而有些地区样本容量较少(如东部)。试以0.01的显著性水平检验各地区平均每天交通事故的次数是否相等? 方差分析:单因素方差分析 SUMMARY

组 观测数 和 平均 方差

列 1 4 57 14.25 6.25 列 2 5 66 13.2 6.7 列 3 5 64 12.8 3.7 列 4 6 55 9.166666667 6.966666667 列 5 6 67 11.16666667 4.566666667 方差分析

差异源 SS df MS F P-value F crit

组间 82.63717949 4 20.65929487 3.676134944 0.020228804 4.368815174 组内 118.0166667 21 5.61984127 总计 200.6538462 25 3.67613494399965<40368815 0.0202288037227386>0.01 不能拒绝原假设,没有足够证据证明验各地区平均每天交通事故的次数相等

分布特征分析

第一部分

1. 某百货公司6月份各天的销售额数据(单位:万元) 见book2.1。

(1)计算该百货公司日销售额的均值、中位数、众数; (2)计算日销售额的标准差。 某百货公司

平均 274.1 标准误差 3.86595812 中位数 272.5 众数 #N/A

标准差 21.17472469 方差 448.3689655 峰度 -0.211917734 偏度 0.195086998 区域 86 最小值 236 最大值 322 求和 8223 观测数 30 最大(1) 322 最小(1) 236 置信度(95.0%) 7.906772022

2. 将某地区120家企业按利润额进行分组,结果如表book2.2,计算120家企业利润额的均值、标准差和离散系数。 平均 426.6666667 标准误差 10.63352695 中位数 450 众数 450

标准差 116.4844515 方差 13568.62745 峰度 -0.624699913 偏度 0.208442033 区域 400 最小值 250 最大值 650 求和 51200 观测数 120 最大(1) 650 最小(1) 250

置信度21.05544515

(95.0%) 离散系数 0.273010433

3. 25个网络用户的年龄(单位:周岁)数据如表book2.3,计算网民年龄的众数、中位数、均值和标准差。 平均 24 标准误差 1.33041347 中位数 23 众数 19 标准差 6.652067348 方差 44.25 峰度 0.772705131 偏度 1.080110357 区域 26 最小值 15 最大值 41 求和 600 观测数 25 最大(1) 41 最小(1) 15 置信度(95.0%) 2.745838427

第二部分

1. 某地区粮食生产情况如表book2.4所示,计算该地区粮食平均亩产量、亩产量的标准差。 平均 286 标准误差 8.027100562 中位数 325 众数 325

标准差 80.27100562 方差 6443.434343 峰度 -0.393495826 偏度 -0.128212443 区域 300 最小值 125 最大值 425

求和 28600 观测数 100 最大(1) 425 最小(1) 125 置信度(95.0%) 15.9275086

2. 某公司下属的三个企业计划完成情况如表book2.5,计算该公司的平均计划完

成程度。

实际产量/件 计划产值 1.2 450 375 1.05 315 300 0.95 361 380 1126 1055

平均计划完成程度 1.067298578

3. 某工业企业某车间工人加工零件情况如表book2.6,要求确定该车间工人加工

零件数的众数、中位数、均值和标准差。

平均 44.3 标准误差 1.208179196 中位数 45 众数 45

标准差 12.08179196 方差 145.969697 峰度 1.049323481 偏度 0.452252788 区域 60 最小值 15 最大值 75 求和 4430 观测数 100 最大(1) 75 最小(1) 15 置信度(95.0%) 2.397289579

4.两个生产车间工人按某产品日产量(件)分组资料如表book2.7,分析两个车间日产量的平均水平,并说明其代表性的优劣。

车间总产量 车间日产量平均值

340 356

8.5 11.86666667 第二车间的产量平均值高,因此第二车间生产好于第一车间。

假设检验练习题

1.经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了20个框架测得比值数据见book4.1表。

在显著性水平?=0.05时能否认为该厂生产的工艺品框架宽与长的平均比例为0.618? 列1 平均 0.6583 标准误差 0.020855783 中位数 0.6215 众数 0.606 标准差 0.093269897 方差 0.008699274 峰度 3.362449574 偏度 1.777452646 区域 0.38 最小值 0.553 最大值 0.933 求和 13.166 观测数 20 最大(1) 0.933 最小(1) 0.553 置信度(95.0%) 0.043651655 H0:

u=0.618,H1:u≠0.618 0.0403 0.020855783 1.932317766

2.093024054

2.09302404985486> 1.932317766 不能拒绝原假设

2.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者在面积相等、土壤等条件相同的20块田地,分别施用新旧两种肥料,得到新肥料所生产的产量数据见book4.2。通过计算得出对应旧肥料所生产的平均产量为100公斤,检验新肥料的产量是否显著高于旧肥料。(显著性水平?=0.05)

平均 100.7 标准误差 1.098084457 中位数 101 众数 98 标准差 4.91078298 方差 24.11578947 峰度 1.126259505 偏度 -0.610870917 区域 21 最小值 88 最大值 109 求和 2014 观测数 20 最大(1) 109 最小(1) 88 置信度(95.0%) 2.298317176 H0:u≤100,H1>100 0.7 1.098084457 1.729132812 1.729133>0.637474 不能拒绝原假设

3.某种电子元件的寿命服从正态分布,现测得16只元件的寿命见book4.3,问是否有理由认为元件的平均寿命显著地低于240小时?(显著性水平为0.05) 平均 235.4736842 标准误差 21.02273462 中位数 222 众数 #N/A 标准差 91.63597572 方差 8397.152047 峰度 1.974300177 偏度 1.300917624 区域 384 最小值 101 最大值 485 求和 4474 观测数 19 最大(1) 485 最小(1) 101 置信度(95.0%) 44.16712644 H0:u≥240,H1:u<240 4.526315789 21.02273462 0.215305757 1.734063607 0.215305756905094< 1.734064

不能拒绝原假设

4.从某大学经济系国际贸易专业2008级学生的统计学考试成绩见book4.4,在显著性水平0.05下能否认为该班统计学成绩显著地高于75分。 平均 76.22807018 标准误差 1.435107941 中位数 78 众数 81 标准差 10.83482735 方差 117.3934837 峰度 -0.071588364 偏度 -0.515379994 区域 50 最小值 46 最大值 96 求和 4345 观测数 57 最大(1) 96 最小(1) 46

置信度(95.0%) 2.874866642 H0:u≤75,H1:u>75 15 9.006820028 1.665404655 Z

时间序列分析练习题

1. 1981年~2000年我国财政用于文教、科技、卫生事业费支出额数据见book8.1表。

(1)用绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。

(3)用5期移动平均法预测2001年用于该项的支出额.

年份与费用支出额呈正相关

234.35 276.06 317.22 369.73 427.76 104.1116523 487.88 113.2792545 553.49 124.2932618 631.54 138.5540035 725.87 165.0585911 870.84 239.3241507 1040.79 300.4450033 1240.04 358.5947871 1462.17 402.9255552 1701.49 438.8792421 1927.47 453.4573278 2181.43 480.6115934 2001年的预测值为2181.43

SUMMARY OUTPUT 回归统计 Multiple R 0.942823394 R Square 0.888915952 Adjusted

R Square 0.882744616 标准误差 276.2009589 观测值 20 方差分析

Significance

df SS MS F F 回归分析 1 10988334.47 10988334.47 144.0394671 5.03539E-10 残差 18 1373165.455 76286.96972 总计 19 12361499.92

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept -363.6092632 128.3040336 -2.833965955 0.011004682 -633.1660348 -94.0524915年份t 128.5449774 10.71061379 12.00164435 5.03539E-10 106.0428129 151.047142

回归方程:当t=21时,

y=128.54t-363.61 y=2335.73

2. 1981年~2000年我国油菜籽单位面积产量数据(单位:kg/hm)见book8.2表。 (1)根据绘制时间序列图描述其形态。

(2)用5期移动平均法预测2001年的单位面积产量。 (3)建立一个趋势方程预测各年的单位面积产量

年份增长,单位面积产量基本保持持平

1293.6 1243.4 1221 1191.4 1164 89.33698003 1167 96.11713687 1170 96.26417818 1174.2 106.0369747 1232 80.95707505 1272.2 75.5985185 1303.4 80.7532538 1333.8 79.60236177 1373.4 79.2815237 1366 82.86712255 1400.6 87.68913274 1421.2 84.06307156 2001年估计值时1421.2 SUMMARY OUTPUT 回归统计

Multiple R 0.45173525 R Square 0.204064736 Adjusted R Square 0.15984611 标准误差 119.2106022 观测值 20

方差分析

Signific

df SS MS F ance F

65583.1865583.184.6149040.045555

回归分析 1 195 195 523 718

255801.014211.16

残差 18 18 767 总计 19 321384.2

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%

55.3770721.525622.6977E-1075.6831308.369

Intercept 1192.026316 46 815 14 399 232

4.6227882.1482320.0455550.21870819.64294

年份 9.930827068 871 884 718 057 608 回归方程:y=9.93x1+1192.02631578947

3. 一家旅馆过去18个月的营业额数据见book8.3表。

(1)根据绘制时间序列图描述其形态。

(2)用3期移动平均法预测第19个月的营业额。 (3)建立一个趋势方程预测各月的营业额

营业额与月份正相关 300 320 321 340

348.6666667 397

31.27299154 36.38223009 35.5501732 35.22520142

412

442.6666667 455.6666667 474.6666667 466.6666667 491.3333333 531.3333333 577.3333333 610.6666667 630.3333333

第19个月的预测值为630.33万元 SUMMARY OUTPUT 回归统计

Multiple R 0.967257104 R Square 0.935586306 Adjusted R Square 0.93156045 标准误差 31.66276183 观测值 18 方差分析

27.96095161

27.20362176 20.57146531 19.71181259 13.63410756 32.28002478 51.4436045 50.73022329 44.93699293 26.36074523

Signific

df SS MS F ance F

232982.4232982.4232.39435.99425E

回归分析 1 567 567 857 -11

16040.481002.530

残差 16 779 487

249022.9

总计 17 444

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%

15.5705415.396505.16349E206.7239272.7401

Intercept 239.7320261 955 386 -11 359 164

1.43847315.244485.99425E18.8793624.97822

月份 21.92879257 625 706 -11 473 041 回归方程:y=21.9287925696594x1+239.732026143791

统计指数练习题

1.某商店三种商品的销售情况如下表,

商品名称 计量单位 销售量 销售价格(元) 基期 报告期 基期 报告期 甲 件 40000 60000 10 8 乙 米 80000 88000 8 8 丙 千克 60000 30000 3 4.5 (1)分析该商店三种商品的销售量总指数及由于销售量变动引起的销售额的增加额;

(2)分析该商店三种商品的价格总指数及由于价格变动引起的销售额的增加额;

(3)分析该商店三种商品的销售额总指数及报告期较基期的销售额的增加额; 商品名计量单销售量 销售价格(元) 称 位 基期q0 报告期基期p0 报告期q1 p1 p0q1 p0q0

甲 件 40000 60000 10 8 600000 400000 乙 米 80000 88000 8 8 704000 640000 丙 千克 60000 30000 3 4.5 90000 180000 1394000 1220000 [1] 销售量指数 1.142622951 销售额的增加额 174000 [2] 价格总指数 0.946197991 销售额的增加额 -75000 [3] 销售额总指数 1.081147541

报告期较基期的销售额的增加

99000

2.某企业三种商品的成本情况如下表, 商品名称 计量单位 产量 产品单位成本(元) 基期 报告期 基期 报告期 甲 件 90 110 10 9 乙 箱 48 60 5 4.2 丙 千克 160 240 8 6.4 (1)分析三种商品的产量总指数及由于产量变动引起的总成本的增加额; (2)分析三种商品的产品单位成本总指数及由于产品单位成本变动引起的总成本的增加额;

(3)分析三种商品的总成本指数及报告期较基期的总成本的增加额。 商品名计量单产量 产品单位成本(元) 称 位

基期q0 报告期基期p0 报告期q1 p1 p0q1 p0q0

p1q1 480000

704000 135000 p1q1

1319000

甲 乙 丙 件 箱 千克 90 48 160 110 60 240 [1] [2] 1100 900 300 240 1920 1280

3320 2420

产量总指数 1.371900826 总成本的增加额 900 单位成本总指数 0.836746988 总成本的增加额 -542 10 5 8 9 4.2 6.4 990 252 1536 2778

[3] 总成本指数 1.147933884

总成本的增加额 358

3.某工厂工人产量统计分组资料如下表, 工人按生产工人数(人) 每天平均产量(件) 技术熟练程基期 报告期 基期 报告期 度分组 第一组 100 120 100 110 第二组 300 400 70 75 第三组 100 280 40 42 (1)计算固定构成指数及由于各组工人每天平均产量变动引起的所有工人平均产量的增加额;

(2)计算结构影响指数及由于工人熟练程度结构分配变动引起的所有工人平均产量的增加额;

(3)计算可变构成指数及报告期较基期的所有工人每天平均产量的增加额。 工人按工人数(人) 每天平均产量生产技(件) 术熟练程度分基期f0 报告期基期x0 报告期x1f1 x0f1 组 f1 x1

第一组 100 120 100 110 13200 12000 第二组 300 400 70 75 30000 28000 第三组 100 280 40 42 11760 11200 500 800 210 227 54960 51200 [1] 固定构成指数 1.0734375 平均产量的增加额 4.7 [2] 结构影响指数 0.914 平均产量的增加额 -6 [3] 可变构成指数 1.57

每天平均产量的增加

19960

x0f0 10000 21000 4000 35000

一元线性回归练习题

1. 各地区城镇居民2007年的人均消费水平和人均可支配收入的统计数据见book6.1表。

(1)人均可支配收入作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)检验回归方程线性关系的显著性 (? =0.05)。

(5)如果某地区的人均可支配收入为25000元,预测其人均消费水平。

人均可支配收入与人均消费水平呈正相关

人均消费支出(元) 人均可支配收入(元)

人均消费支出(元) 1 人均可支配收入(元) 0.976025367 1 相关系数为0.971098,接近于1,相关性很强 SUMMARY

OUTPUT 回归统计 Multiple

0.976025367

R

R Square 0.952625517 Adjusted

0.950991914

R Square

标准误差 559.3304731 观测值 31

方差分析

回归分析 1

df

SS

182436901.4

MS

182436901.4

残差 29 9072666.765 312850.5781 总计 30 191509568.1

Coefficients 标准误差 t Stat Intercep

450.3340782 388.9055916 1.157952181

t

人均可支

0.691971456 0.028654994 24.14837229

配收入

回归方程:y=0.692x+450.334

相关系数的意义:人均可支配收入每增加1元,人均消费增加0.692元 F值远远小于0.05,方程相关性显著 x=25000时,估计值为17750.334

SignificF

ance F

583.14389.38075E

845 -21 P-value Lower 95% Upper 95% 0.256331-345.0671245.735528 1538 31

9.38075E0.6333650.750577-21 415 498

2. 某随机抽取的10家航空公司,对其最近一年的航班正点率和顾客投诉次数

进行了调查,所得数据见book6.2表。 (1)绘制散点图,说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。

(4)检验回归系数的显著性 (? =0.05)。

(5)如果航班正点率为80%,估计顾客的投诉次数。

航班正点率与投诉次数负相关 航班正点率/% 投诉次数/次

航班正点率/% 1

投诉次数/次 -0.868642626

接近于-1,相关性强 SUMMARY OUTPUT

回归统计

Multiple R 0.868642626 R Square 0.754540012 Adjusted

R Square 0.723857513 标准误差 18.88721792 观测值 10 方差分析

1

Significance

df SS MS F F 回归分析 1 8772.583994 8772.583994 24.5918699 0.001108261 残差 8 2853.816006 356.7270008 总计 9 11626.4

Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 430.1892329 72.15483219 5.962029428 0.000337402 263.7998916 596.5785742 航班正点率/% -4.700622632 0.947893644 -4.959019047 0.001108261 -6.886469292 -2.514775972 回归方程: y=-4.7x+430.189

回归系数的意义:航班正点率每增加百分之1,投诉数减少4.7

p值小于0.05,相关性强

x=80%时, 426.429

3. 随机抽取7家超市,得到其广告费支出和销售额数据见book6.3表。

(1)用广告费支出作自变量,销售额为因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)检验广告费支出与销售额之间的线性关系是否显著 (? =0.05)。

广告支出费用与销售额呈正相关 广告费支出/万元

广告费支出/万元 1 销售额/万元 0.830868141 相关系数0.83接近于1,相关性强

方差分析

回归分析 1 残差 总计

5 6

Coeffici ents Intercep29.39910t 979 广告费支1.547477出/万元 745

df

销售额/万元

1

Signific

SS MS F ance F 691.7225691.722511.146830.020582519 519 9 051 310.277462.05548481 961 1002 标准误差 t Stat 4.8072536.115573405 138 0.4634983.338688729 216

P-value Lower 95% Upper 95%

0.00169417.0416741.75654771 151 807 0.0205820.3560162.738939051 331 158

回归方程:y=1.547x+29.40

系数的意义:表示广告费支出每增加1万元,销售额增加1.547

万元

F值0.02小于0.05,所以广告费支出与销售额之间的线性关系是显著的

本文来源:https://www.bwwdw.com/article/ipn2.html

Top