sas课程设计论文

更新时间:2024-01-29 15:27:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SAS课程设计报告

学生姓名:朱世琪 班级:信计C081 指导教师:睢百龙 学号:085102

选择的对象阐述及分析:

在选择数据方面一度陷入绝境,有的数据不是不合适就是量不全,可用数据一时洛阳纸贵啊。最后把想要研究得数定位在建筑业总产值上面,也是应对时下抄房热,房价居高不下的社会现象。希望可以通过对房建筑业总产值方面的分析,调查;再对比当今商品房的现价知道开发商到底那了几分利。

建筑业在一定时期内完成的以价值表现的生产总量,是反映建筑业生产成果的综合指标。通过它可以了解建筑业的生产规模、发展速度、经营成果,并为国家制订经济建设计划提供依据。中国现行统计制度规定,建筑业总产值包括:①施工产值,即建筑企业自行完成的建筑工程产值、设备安装工程产值、建筑物大修理价值及非标准设备制作的产值。②附属、辅助生产单位为外单位提供的建筑制品和工业性作业价值。③为外单位进行建筑安装提供服务的产值和建筑机械租赁收入。④其他产值,如企业所属勘察设计单位向外单位提供的科研成果、技术服务和劳务的收入等。⑤勘察设计产值等。

在知道以上定义后我结合在国家统计局找到的数据开始了我的分析,但是数据量着实不是小数(随便一个投资商都是10位数的撒钱啊),由于个人能力有限,所以只挑选了一年的几个城市进行了数据分析。

通过对建筑业总产值的调查,大体可按行业和登记注册类型分为两类。这两类又有各自有几个下属项。登记注册类包括:内资企业,港澳台商投资企业,外商投资企业。以下就是我对着两类进行的整理;行业类包含房屋和土木工程建筑业,建筑安装业,建筑装饰业,其他建筑业。

获得数据过程:

国家统计局年鉴2010年建筑业类2009年全国各地建筑业总产值表格数据

1

整理数据后的结果:

按行业分

地区 上海 江苏 浙江 安徽 福建 江西 山东 湖北

合计 38305439 102651097 95887214 22395727 22041266 13232428 45791538 35964867

房屋和土木工程建筑业

30588432 88782270 89268136 19433868 19536624 11819780 39160019 31285017

建筑安装业 4860188 8491240 3259732 2090764 1271125 904755 4784577 2894558

建筑装饰业

其他建筑业

按登记注册类型分

港澳台

外商投

内资企业 商投资

资企业

企业

36727537 794023 783879 1.01E+08 370942 803847 95381854 166235 339125 2.23E+08 26469 34812 21800701 220116 20449 13191173 39649 1606 45434616 73173 283749 35928834 22354 13680

2591858 264961

4388136 1989452 2608981 750365 633210 237885 798069 435448 280372 2271521 1179146 667817 816211 969081

导入数据时建表如下表:

area 1 2 3 4 5 6 7 8

total

38305439 102651097 95887214 22395727 22041266 13232428 45791538 35964867

A

30588432 88782270 89268136 19433868 19536624 11819780 39160019 31285017

B

4860188 8491240 3259732 2090764 1271125 904755 4784577 2894558

C

2591858 4388136 2608981 633210 798069 280372 1179146 816211

D

264961 1989452 750365 237885 435448 2271521 667817 969081

E

36727537 1.01E+08 95381854 2.23E+08 21800701 13191173 45434616 35928834

F

794023 370942 166235 26469 220116 39649 73173 22354

G

783879 803847 339125 34812 20449 1606 283749 13680

2

分析与用到的章名:

第二章:折线图

图示:上海、江苏、浙江、安徽、福建、江西、山东、湖北以上城市建筑业总产值

1000000008000000060000000400000002000000024area68total

图示:E内资企业建筑业总产值

F 港澳台商投资企业建筑业总产值 G 外商投资企业建筑业总产值

20000000015000000010000000050000000EFG24area68

3

图示:A 房屋和土木建筑业 B 建筑安装业 C 建筑装饰业 D 其他建筑业

80000000ABCD40000000200000006000000024area68

第三章:总体均值的区间估计

注:区间从LCL至UCL之间,均值是Mean

1、建筑业总产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL47033697.018675131.675392262.433920880.022427609.069038220.4 1.151E+15 5.030E+14 4.766E+15

2、房屋和土木工程建筑业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL41234268.315571312.366897224.230696547.520295763.762475826.4 9.423E+14 4.119E+14 3.903E+15

3、建筑安装业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL3569617.381509945.475629289.282463660.711628908.785014219.89 6.070E+12 2.653E+12 2.514E+13

4

4、建筑装饰业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL948316.250301674.5101594957.99773475.548511402.0371574233.20 5.983E+11 2.615E+11 2.478E+12

5、其他建筑业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL1661997.88485806.7592838188.991406891.96930200.5972863407.95 1.979E+12 8.653E+11 8.199E+12

6、内资企业建筑业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL71660680.113783238.0 12953812269229657.545772859.9 140901190 4.793E+15 2.095E+15 1.985E+16

7、港澳台商投资企业建筑业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL214120.125-6052.8507434293.101263358.213174125.642536005.620 6.936E+10 3.032E+10 2.873E+11

8、外商投资企业建筑业产值

ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL285143.375 1191.2437569095.506339647.160224565.922691274.384 1.154E+11 5.043E+10 4.779E+11

5

第四章:多元线性回归

1、A B C D 建筑业总产值与房屋和土木工程建筑业产值和建筑安装业产值和建筑装饰业产值和其他建筑业产值的关系

Model Equationtotal = 116288 + 1.0117A + 1.1142B + 0.7166C + 0.0347D R_total_22000000080000000P_total_2

2、D E F 建筑业总产值与内资企业产值和港澳台投资企业产值和外商投资企业的关系

totalModel Equation = 3.3E+07 - 0.0055E - 125.148F + 144.855G R_total_12000000080000000P_total_1

6

第七章 典型相关系数

Correlation MatrixEFG 0.1905 0.1816 0.6055 0.1111 0.4892 0.8699 0.1202 0.6094 0.9080 -0.2741 -0.2024 0.0662 ABCD

1 2 3CanCorr 0.996012 0.971755 0.373896Canonical CorrelationsAdj. CanCorrApprox Std. Error 0.993543 0.003008 0.964550 0.021050 0.236147 0.325126CanRsq 0.992041 0.944308 0.139798 第1典型相关系数为0.996012,校正值为0.993543,标准误差为0.003008,典型相关系数的平方为0.992041;第2典型相关系数为0.971755,校正值为0.964550,标准误差为0.021050,典型相关系数的平方为0.944308,第3典型相关系数为0.373896,校正值为0.236147,标准误差为00.325126,典型相关系数的平方为0.139798 如上图所示。

1 2 3Eigenvalue124.6392 16.9558 0.1625EigenvaluesDifferenceProportion107.68340.8792 16.79330.1196 _ 0.0011Cumulative0.87920.99891.0000

第二部分是的3个特征根(Eigenvalues),包括:特征根、相邻两个特征根之差、特征根所占方差信息量的比例和累积方差信息量的比例。如上图所示.

K 1 2 3Test of H0: CanCorr[j]=0, j>=KL. RatioApprox FNum DFDen DF 0.000381 4.5517 12 2.9373 0.047907 2.3792 6 4.0000 0.860202 0.2438 2 3.0000Pr > F 0.1226 0.2104 0.7978 用似然比法检验典型相关系数与零的差别是否显著,其原假设为小于此对典型变量典型相关系数的所有典型相关系数都为0,其p值依次为0.1225,0.2104和0.7989. 如上图所示. VariableABCDEFGCorrelations (Structure)CY1_1CY2_1CX1_1 0.5154 0.6511 0.5134 0.3688 0.9098 0.3673 0.1974 0.9461 0.1966 0.5806 0.0499 0.5783 0.0143 0.1089 0.0144 -0.5517 0.7635 -0.5539 -0.0221 0.9660 -0.0222CX2_1 0.6327 0.8841 0.9194 0.0485 0.1121 0.7856 0.9941

7

典型相关结构分别是各组原始变量与典型变量两两之间的相关系数矩阵。如上图所示.

Std Canonical Y CoefficientsVariableCY1_1CY2_1A 1.383369 -0.475887B 1.182207 0.231667C -2.113191 1.168151D 0.461724 -0.121811 Std Canonical X CoefficientsVariableCX1_1CX2_1E -0.357076 0.099199F -1.875731 -0.038529G 1.522716 1.025239 输出结果中还给出标准化变量的典型变量系数,如上图所示。

CY1=1.383369+1.182207-2.113191+0.461724 CY1代表房屋和土木建筑业,建筑安装业,其他建筑业,建筑装饰业 (既按行业分8个城市的建筑业总产值)

CY2=-0.475887+0.231667+1.168151-0.121811

CX1=-0.357706-1.875731+1.522716 CX代表内资企业建筑业总产值,港澳台商投资企业建筑业总产值,外商投资企业建筑业总产值(既按登记注册类型分8个城市的建筑业总产值)

CX2=0.099199-0.038529+1.025239

1 2Std Variance (Y Variables)Explained by CY's Explained by CX'sProportionCumulativeCanRsqProportionCumulative0.19440.1944 0.9920410.19290.19290.53730.7317 0.9443080.50740.7002 1 2Std Variance (X Variables)Explained by CY's Explained by CX'sProportionCumulativeCanRsqProportionCumulative0.10170.1017 0.9920410.10250.10250.50930.6110 0.9443080.53930.6418 典型冗余分析(canonical redundancy analysis)表明,两对典型变量仍不能全面预测配对的那组变量。

所得结果: 来自按登记注册类型分8个城市的建筑业总产值的标准方差被对方两个典型变量(CY1、CY2)解释的累积方差比例为61.10%业分8个城市的建筑业总产值的标准方差被对方两个典型变量(CX1、CX2)解释的累积方差比例为70.02%. 如上图所示.

8

第八章 聚类分析与判别分析

The SAS System 16:44 Monday, December 19, 2011 1 The CLUSTER Procedure

Ward's Minimum Variance Cluster Analysis

Eigenvalues of the Correlation Matrix

Eigenvalue Difference Proportion Cumulative 1 5.12605463 3.54016404 0.5696 0.5696 2 1.58589059 0.26678948 0.1762 0.7458 3 1.31910111 0.75532314 0.1466 0.8923 4 0.56377798 0.18843946 0.0626 0.9550 5 0.37533852 0.35456638 0.0417 0.9967 6 0.02077214 0.01170710 0.0023 0.9990 7 0.00906504 0.00906504 0.0010 1.0000 8 0.00000000 0.00000000 0.0000 1.0000 9 -.00000000 -0.0000 1.0000 The data have been standardized to mean 0 and variance 1 Root-Mean-Square Total-Sample Standard Deviation = 1 Root-Mean-Square Distance Between Observations = 4.242641 Cluster History

NCL --Clusters Joined--- FREQ SPRSQ RSQ PSF PST2 7 OB7 OB8 2 0.0144 .986 11.4 . 6 OB5 CL7 3 0.0382 .947 7.2 2.7 5 CL6 OB6 4 0.0735 .874 5.2 2.8 4 OB2 OB3 2 0.0902 .784 4.8 . 3 OB4 CL5 5 0.1309 .653 4.7 3.1 2 OB1 CL4 3 0.1589 .494 5.9 1.8 1 CL2 CL3 8 0.4939 .00

9

T i e

注:为了进行系统聚类并产生帮助确定类数的统计量,使用如下代码: proc cluster data = mylib.nm10 standard method = ward outtree = otree pseudo; run;

结果中首先给出数据相关系数矩阵特征值方面的信息。结果的最后部分为聚类分析的完整过程(Cluster History),如上图所示,内容按列划分从左到右依次为:“NCL”为类别数量,表示新类别形成后类别的总数;

“--Clusters Joined---”为合并的类别,指明这一步合并了哪两个类,有两列。其中OBxxx表示某一个原始样品,而CLxxx表示在某一个聚类水平上产生的类。 “FREQ”表示这次合并得到的类有多少个样品。

“SPRSQ”是半偏R2,“RSQ”是R2,“PSF”为伪F统计量,“PST2”为伪t2统计量.

个人总结

一个学期的

SAS的学习说长不长说短不短,在此期间我认识

到了SAS的实用性。SAS 系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。

SAS 系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、 SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外, SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计

10

要求。

SAS 是由大型机系统发展而来,其核心操作方式就是程序驱动,经过多年的发展,现在已成为一套完整的计算机语言,其用户界面也充分体现了这一特点:它采用MDI (多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。使用程序方式,用户可以完成所有需要做的工作,包括统计分析、预测、建模和模拟抽样等。

从上述案例可的得知,SAS是一个实用性强、功能完善、使用方便、的计算机软件系统。 它不仅具有一般数据管理系统的功能,还提供了一个完善的可编程语言环境,特别是以标准过程给出了常用的数据处理和复杂计算的算法。

11

本文来源:https://www.bwwdw.com/article/pz4w.html

Top