统计学课程设计(运用SPSS对各行业固定资产投资的统计分析)

更新时间:2023-09-05 05:37:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

学 号

(应用统计学课程设计)

设计说明书

运用SPSS对各行业固定资产投资的

统计分析

起止日期: 2013 年 7 月 1 日 至 2013 年 7 月 5 日

学班成

生姓名 级 绩

/

11电子商务二班

/

指导教师(签字)

经济与管理学院 2013年 7 月 5 日

应用统计学课程设计 课程设计分工及成绩评定表

目 录

1 选用的分析方法 ........................................................ 1 2 描述性分析 ............................................................ 1 2.1全国各地区2012年固定资产投资总额的频数分析 ......................... 1 2.2 对不同行业固定资产投资的描述性统计 .................................. 1 3统计图 ................................................................ 2 4统计报表 .............................................................. 4 5均值比较 .............................................................. 5 6相关分析 .............................................................. 7 7一元线性回归分析 ...................................................... 8 8多元线性回归分析 ...................................................... 9 9总结 ................................................................. 16 10 统计调查方案 ........................................................ 18

1 选用的分析方法

在本次调查中主要运用的分析方法有:描述性分析、统计图、统计报表、均值比较、相关分析、一元线性回归分析、多元线性回归分析。

2 描述性分析

2.1全国各地区2012年固定资产投资总额的频数分析

本设计选择2012年中国统计年鉴中2012年全国各地区按行业分固定资产投资作为统计研究对象,对各地区固定资产投资总额进行频数分析,分析结果如图2-1所示。

从上表可以看出,2012 年各地区固定资产投资总额方面 5000 亿元以下的有 8 个省市, 占25.8%;5000 到 10000 亿元之间的有 11 个省市,占35.5%;10000 到 15000 亿元之间的有 6 个 省市,占19.4%;15000 到 20000 亿元之间的有 4 个省市,占12.9%;在 20000 亿元以上的有 2 个省市,占6.5%,共31 个省市地区。从上面可以看出最多一部分的省市固定资产投资总额在 5000 到10000 亿元之间。

2.2 对不同行业固定资产投资的描述性统计

各地区的投资总额会按一定的计划与实际情况分配到各行各业中,保证全社会的发展。本设计对固定资产投资的农、林、牧、渔业,采矿业,制造业,建筑业,住宿和餐饮业,金融业,房地产业,教育,文化、体育和娱乐业九项投资做描述性统计分析,包括平均值,全距,方差,标准差,最小值,最大值等项目,见表2-2。

表2-2 不同行业固定资产投资的描述性统计

从表 2-2 可以看出,在资产投资中,农、林、牧、渔业最小投资为 11.60 亿元,最大投资为 641.02 亿元,平均投资为 219.97 亿元,标准差为 165.22,方差为 27297.90;采矿业最小投资为 0.57 亿元,最大投资为 1425.93 亿元,平均投资为 354.76 亿元,标准差为 331.96,方差为 110200.43;制造业最小投资为 34.76 亿元、最大投资为 13073.81 亿元,平均投资为 3308.59 亿元,标准差为 3064.57,方差为 9391590.91;建筑业最小投资为 8.91 亿元,最大投资为 476.66 亿元,平均投资为 104.51 亿元,标准差为 128.47,方差为 16504.85;住宿餐饮业最小投资为 7.73 亿元,最大投资为 405.88 亿元,平均投资为 126.41 亿元,标准差为 103.36,方差为 10684.18;金融业最小投资为 0.26 亿元,最大投资为 58.21 亿元,平均投资为 20.60 亿元,标准差为 17.64,方差为 311.10;房地产业最小投资为 52.05 亿元,最大投资为 6587.09 亿元,平均投资为 2440.76 亿元,标准差为 1739.93,方差为 3027342.22;教育最小投资为 15.92 亿元,最大投资为 279.16 亿元,平均投资为 125.50 亿元,标准差为 71.06,方差为 5050.05;文化、体育娱乐业最小投资为 11.06 亿元,最大投资为 542.85 亿元,平均投资为 101.79 亿元,标准差为 97.71,方差为 9547.80。可见各地区对制造业和房地产业的投资力度最大。

3统计图

3.1条形图的绘制

本设计对各投资范围内农、林、牧、渔业,采矿业,制造业,房地产业四类投资用复式条形图展示,如图3-1所示。

图3-1 农、林、牧、渔业,采矿业,制造业,房地产业四类投资条形图分析

从上图可以得知,四类投资的均值不是同步增加的,例如农、林、牧、渔业投资,第四类范围比第五类范围的要高,说明不同的地区在投资方面不相同,与所在地区的投资总额不是正相关。且可以看出对制造业与房地产业的投资要远比其他行业的投资高。 3.2饼图的绘制

对表2-1的频数分析以饼图的形式展示,如图3-2

图3-2 各范围投资总额所包含的地区数目

4统计报表

对六类地区的农、林、牧、渔业,采矿业,制造业,房地产业的投资做行统计报表,并输出均值(M)、最小值、最大值。 投资总额(已离散化)

5000以下

农、林、牧、渔业

18.53 11.60 49.19

24.15 113.87 77.86 37.80 149.07

5000~10000

40.63 142.92 222.78

采 矿 业 .57 14.90 407.78 15.28 213.72 88.00 124.77 653.11 8.71 227.53 1425.93

制 造 业 1097.49 132.55 792.16 34.76 734.71 359.99 423.09 1147.84 570.20 2546.43 1365.41

房地产业 2307.64 734.40 996.32 52.05 627.75 276.75 384.28 909.75 3192.06 1342.47 1325.82

195.83 447.98 152.66 182.12 231.62 274.01 95.89 344.36

10000~15000

417.56 93.44 184.24 331.07 333.36 205.58

15000~20000

428.10 469.81 641.02 213.58

20000以上

155.20 533.34

合计 均值 最小值 最大值

6819.19 219.9739 11.60 641.02

394.63 567.76 111.05 228.68 250.60 148.29 261.95 892.22 975.56 24.98 305.49 229.07 442.23 409.23 575.98 546.61 717.43 74.71 68.02 592.62 10997.42 354.7556 .57 1425.93

3206.94 2012.73 3059.70 4643.36 2289.31 2056.06 987.88 1876.94 2787.48 4473.80 5067.50 4732.57 3923.99 3892.12 6114.07 5973.23 7901.31 4523.32

13073.81 10765.55 102566.33 3308.5913 34.76 13073.81

1414.71 1650.54 2690.12 1094.18 1767.20 2298.25 1469.36 2076.49 1836.69 4845.49 3257.09 2483.15 2304.85 3645.53 4064.48 4707.03 3758.00 5532.58 6587.09 6031.58 75663.70 2440.7644 52.05 6587.09

5均值比较

对不同类别地区各投资项目进行分析,分析结果如下。

表5-1 案例处理摘要

表格5-2 报告

从上面可以看出 5000 亿元以下、5000~10000 亿元、10000~15000 亿元、15000~20000 亿元、20000 亿元以上六类城市制造业的投资均值分别为590.33、2237.72、4146.24、6127.98、11919.68表明不同类别城市的制造业投资有很大的差异,投资总额越多,制造业投资业相应增加。

6相关分析

本设计对农、林、牧、渔业、采矿业、制造业、建筑业、住宿和餐饮业、金融业、房地产业、教育八项投资做相关分析,分析结果如表6-1 所示。

表6-1 相关系数表

从上表可以得知,农、林、牧、渔业投资与采矿业、制造业、住宿和餐营业、教育的投资呈在0.01置信度条件下呈高度正相关。(下同)

7一元线性回归分析

本设计把投资总额作为自变量,农、林、牧、渔业投资作为因变量,做一元线性回归分析,分析结果如下所示。

表7-1 模型摘要

表7-2 方差分析表Anova

b

由表 7-1 所示,本次回归分析得到的相关系数 R=0.622,调整的决定系数R方为 0.365,模型拟合效果很理想。从表7-2 可以看出,离差平方和为 818937.108,残差平方和为 502566.053、回归平方和为 316371.055,显著性检验统计量F为 18.256,对应的置信水平为 0.000,远比常用的置信水平 0.05 要小,认定方程是显著的。从表7-3 可以看出回归方程为y(投资总额)=0.016

(农、林、牧、渔业投资)+ 67.887,可知每增加 100 元的投资总额,里面增加了 1.6 元的农、林、牧、渔业投资。回归系数检验统计量t=4.273,相伴概率值为 0.000<0.001,认为两个变量线性关系极为显著,建立的回归方程是有效的。

8多元线性回归分析

本设计把农、林、牧、渔业、采矿业、制造业、建筑业、住宿和餐饮业、金融业、房地产业、教育作为自变量,投资总额作为因变量,做多元线性回归分析,分析结果如下所示。

表8-1 模型汇总

表8-2 方差分析表Anova

b

表8-3 回归系数表

由表8-1所示,本次回归分析得到的相关系数R=0.996,调整的决定系数R2为0.993,模型的解释能力很强。从表8-2可以看出,离差平方和为 1.253E9,残差平方和 9246399.377、回归平方和为 1.244E9,显著性检验统计量F为370.001,对应的置信水平为0.000,远比常用的置信水平0.05要小,认定方程整体很显著。从表7-3可以看出回归方程为:投资总额=1.641农、林、牧、渔业+1.591采矿业+1.000制造业+1.039建筑业+5.222住宿和餐饮业+2.088金融业+1.310房地产业+9.089教育+189.323

有较多变量显著性 P 值大于 0.05,所以很多系数都不显著,剔除掉不显著因素,再次分析的结果:

8-4 模型汇总

表8-5 方差分析表Anova

f

c. 预测变量: (常量), 制 造 业, 教 育, 房地产业。

d. 预测变量: (常量), 制 造 业, 教 育, 房地产业, 采 矿 业。

e. 预测变量: (常量), 制 造 业, 教 育, 房地产业, 采 矿 业, 住宿和餐饮业。 f. 因变量: 投资总额

表8-6 回归方程

表8-7 已排除的变量

投资总额=1.038*制造业+9.534*教育+1.296*房地产业+2.079*采矿业+6.076*住宿和餐饮业+272.809

其经济意义表示为:制造业每多投资 10 元,总投资额要增长 10.38 元,教育每多投资 10 元,总投资额要增长 95.34 元,其它同。

附原始数据(截图)

9总结

课设总结

这个学期的应用统计学课程,学习了各种各样的统计方法,在临近学期末的这段时间里,利用SPSS软件做了一项课程设计。通过这次的课程设计,不仅让我们学习的应用统计学的多元化知识,而且增加了我们对统计学的学习兴趣。

而我们在课程设计中,我们完成了数据整理和数据分析。包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、数据简化、多重响应等等。

在课程设计中,我们主要做了描述性分析、制作统计图、制统计报表、数据均值比较、相关分析、一元线性回归分析、多元线性回归分析。

描述性统计分析过程就是计算并列出一系列描述性统计量指标。它可以将原始数据转换成标准化值,并一边凉的形式存入数据库,供进一步分析。将原始数据变量X转化成新的的标准化值变量Z称为Z分数。其中Z分数,是从平均数为μ、标准差为σ的中提中抽出一个变量值X,Z分数表示的是此变量大于或小于平均数几个标准差。计算公式为:

Z=x-μ/σ

我们通过对数据的描述性统计,能够很容易的发现各组数据之间的联系,极大地方便了我们队数据之间联系的分析,能够能好的得出所想预计的结果。

在制图表方面,根据报表制作的侧重点不同,可以分为三种: 1. Cases Summary(个案简明统计报表):计算指定变量的分组统计量。 2. Report Summaries in Rows(行形式报表):一行为对象生成各种统计结果。 3. Report Sunmmaries in Colums(列形式报表):以列为对象生成各个列相应的统计信息。 通过制表制图,我们能一目了然的看清数据的分布,多组数据有层次的、有顺序的排布,方便了对数据的研究。

Means(均值)过程。Means过程其实就是对样本进行分组计算均值和标准差,如按照性别计算各族的均值和标准差。可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定这些分组变量之间的层次关系。层次关系可以是同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按照第一分组变量分组。然后对各个分组下的个案按照第二分组变量进行分组。

做完均值的项目后,我们能发现,凌乱的数据在区的均值和方差后,不同时期的数据都存在这不同程度的变化,而这些变化,存在这一定的规律。

相关分析。一般来说现象之间的相互关系可以分为两种,一种是函数关系,另一种是相关关系。相关关系是两个现象数值变化不完全确定的一寸关系。按照相关的程度分,有完全相关、不完全相关和不相关;按照相关的性质分,有正相关和负相关。测定变量之间线性相关程度和相关方向的统计指标是相关系数,同时要对相关系数的显著性检验。

数据的相关分析,是研究数据之间的联系的,利用SPSS,我们能发现,在大量数据之中,各组数据,都存在这一定的相关关系,这些关系是微妙的,而且不容忽视。

一元线性回归是设计一个自变量的回归分析,主要是处理两个变量(因变量和自变量)之间的线性关系,建立线性数学模型并进行评价预测。即y=β0+β1x+ε,式中β0和β1为未知参数,β0为回归常数,β1为回归系数,ε为随机扰动项。

在研究线性相关时,同时伴随着多元线性回归分析,即两个或两个以上自变量对一个因变量的数量变化关系,表现这一数量关系的数学公式成为多元线性回归模型。多远线性回归模型是一元线性回归模型的扩张,其基本原理与一元线性回归模型类似,只是在计算上较为复杂,一般需要借助计算机来完成。多远线性回归,也需要测定方程拟合程度、检验回归方程和回归系数的显著性。

数据的一元与多元线性相关分析,我们发现,各组数据,都有影响其变化的因素,研究一元线性模型时,我们只需要研究一项便可;在多元线性模型里,我们研究的,便是多元化的影响因素,

本文来源:https://www.bwwdw.com/article/1a6i.html

Top