sas课程设计论文
更新时间:2024-01-29 15:27:01 阅读量: 教育文库 文档下载
SAS课程设计报告
学生姓名:朱世琪 班级:信计C081 指导教师:睢百龙 学号:085102
选择的对象阐述及分析:
在选择数据方面一度陷入绝境,有的数据不是不合适就是量不全,可用数据一时洛阳纸贵啊。最后把想要研究得数定位在建筑业总产值上面,也是应对时下抄房热,房价居高不下的社会现象。希望可以通过对房建筑业总产值方面的分析,调查;再对比当今商品房的现价知道开发商到底那了几分利。
建筑业在一定时期内完成的以价值表现的生产总量,是反映建筑业生产成果的综合指标。通过它可以了解建筑业的生产规模、发展速度、经营成果,并为国家制订经济建设计划提供依据。中国现行统计制度规定,建筑业总产值包括:①施工产值,即建筑企业自行完成的建筑工程产值、设备安装工程产值、建筑物大修理价值及非标准设备制作的产值。②附属、辅助生产单位为外单位提供的建筑制品和工业性作业价值。③为外单位进行建筑安装提供服务的产值和建筑机械租赁收入。④其他产值,如企业所属勘察设计单位向外单位提供的科研成果、技术服务和劳务的收入等。⑤勘察设计产值等。
在知道以上定义后我结合在国家统计局找到的数据开始了我的分析,但是数据量着实不是小数(随便一个投资商都是10位数的撒钱啊),由于个人能力有限,所以只挑选了一年的几个城市进行了数据分析。
通过对建筑业总产值的调查,大体可按行业和登记注册类型分为两类。这两类又有各自有几个下属项。登记注册类包括:内资企业,港澳台商投资企业,外商投资企业。以下就是我对着两类进行的整理;行业类包含房屋和土木工程建筑业,建筑安装业,建筑装饰业,其他建筑业。
获得数据过程:
国家统计局年鉴2010年建筑业类2009年全国各地建筑业总产值表格数据
1
整理数据后的结果:
按行业分
地区 上海 江苏 浙江 安徽 福建 江西 山东 湖北
合计 38305439 102651097 95887214 22395727 22041266 13232428 45791538 35964867
房屋和土木工程建筑业
30588432 88782270 89268136 19433868 19536624 11819780 39160019 31285017
建筑安装业 4860188 8491240 3259732 2090764 1271125 904755 4784577 2894558
建筑装饰业
其他建筑业
按登记注册类型分
港澳台
外商投
内资企业 商投资
资企业
企业
36727537 794023 783879 1.01E+08 370942 803847 95381854 166235 339125 2.23E+08 26469 34812 21800701 220116 20449 13191173 39649 1606 45434616 73173 283749 35928834 22354 13680
2591858 264961
4388136 1989452 2608981 750365 633210 237885 798069 435448 280372 2271521 1179146 667817 816211 969081
导入数据时建表如下表:
area 1 2 3 4 5 6 7 8
total
38305439 102651097 95887214 22395727 22041266 13232428 45791538 35964867
A
30588432 88782270 89268136 19433868 19536624 11819780 39160019 31285017
B
4860188 8491240 3259732 2090764 1271125 904755 4784577 2894558
C
2591858 4388136 2608981 633210 798069 280372 1179146 816211
D
264961 1989452 750365 237885 435448 2271521 667817 969081
E
36727537 1.01E+08 95381854 2.23E+08 21800701 13191173 45434616 35928834
F
794023 370942 166235 26469 220116 39649 73173 22354
G
783879 803847 339125 34812 20449 1606 283749 13680
2
分析与用到的章名:
第二章:折线图
图示:上海、江苏、浙江、安徽、福建、江西、山东、湖北以上城市建筑业总产值
1000000008000000060000000400000002000000024area68total
图示:E内资企业建筑业总产值
F 港澳台商投资企业建筑业总产值 G 外商投资企业建筑业总产值
20000000015000000010000000050000000EFG24area68
3
图示:A 房屋和土木建筑业 B 建筑安装业 C 建筑装饰业 D 其他建筑业
80000000ABCD40000000200000006000000024area68
第三章:总体均值的区间估计
注:区间从LCL至UCL之间,均值是Mean
1、建筑业总产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL47033697.018675131.675392262.433920880.022427609.069038220.4 1.151E+15 5.030E+14 4.766E+15
2、房屋和土木工程建筑业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL41234268.315571312.366897224.230696547.520295763.762475826.4 9.423E+14 4.119E+14 3.903E+15
3、建筑安装业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL3569617.381509945.475629289.282463660.711628908.785014219.89 6.070E+12 2.653E+12 2.514E+13
4
4、建筑装饰业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL948316.250301674.5101594957.99773475.548511402.0371574233.20 5.983E+11 2.615E+11 2.478E+12
5、其他建筑业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL1661997.88485806.7592838188.991406891.96930200.5972863407.95 1.979E+12 8.653E+11 8.199E+12
6、内资企业建筑业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL71660680.113783238.0 12953812269229657.545772859.9 140901190 4.793E+15 2.095E+15 1.985E+16
7、港澳台商投资企业建筑业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL214120.125-6052.8507434293.101263358.213174125.642536005.620 6.936E+10 3.032E+10 2.873E+11
8、外商投资企业建筑业产值
ParameterMean Std Dev Variance95% Confidence IntervalsEstimateLCLUCL285143.375 1191.2437569095.506339647.160224565.922691274.384 1.154E+11 5.043E+10 4.779E+11
5
第四章:多元线性回归
1、A B C D 建筑业总产值与房屋和土木工程建筑业产值和建筑安装业产值和建筑装饰业产值和其他建筑业产值的关系
Model Equationtotal = 116288 + 1.0117A + 1.1142B + 0.7166C + 0.0347D R_total_22000000080000000P_total_2
2、D E F 建筑业总产值与内资企业产值和港澳台投资企业产值和外商投资企业的关系
totalModel Equation = 3.3E+07 - 0.0055E - 125.148F + 144.855G R_total_12000000080000000P_total_1
6
第七章 典型相关系数
Correlation MatrixEFG 0.1905 0.1816 0.6055 0.1111 0.4892 0.8699 0.1202 0.6094 0.9080 -0.2741 -0.2024 0.0662 ABCD
1 2 3CanCorr 0.996012 0.971755 0.373896Canonical CorrelationsAdj. CanCorrApprox Std. Error 0.993543 0.003008 0.964550 0.021050 0.236147 0.325126CanRsq 0.992041 0.944308 0.139798 第1典型相关系数为0.996012,校正值为0.993543,标准误差为0.003008,典型相关系数的平方为0.992041;第2典型相关系数为0.971755,校正值为0.964550,标准误差为0.021050,典型相关系数的平方为0.944308,第3典型相关系数为0.373896,校正值为0.236147,标准误差为00.325126,典型相关系数的平方为0.139798 如上图所示。
1 2 3Eigenvalue124.6392 16.9558 0.1625EigenvaluesDifferenceProportion107.68340.8792 16.79330.1196 _ 0.0011Cumulative0.87920.99891.0000
第二部分是的3个特征根(Eigenvalues),包括:特征根、相邻两个特征根之差、特征根所占方差信息量的比例和累积方差信息量的比例。如上图所示.
K 1 2 3Test of H0: CanCorr[j]=0, j>=KL. RatioApprox FNum DFDen DF 0.000381 4.5517 12 2.9373 0.047907 2.3792 6 4.0000 0.860202 0.2438 2 3.0000Pr > F 0.1226 0.2104 0.7978 用似然比法检验典型相关系数与零的差别是否显著,其原假设为小于此对典型变量典型相关系数的所有典型相关系数都为0,其p值依次为0.1225,0.2104和0.7989. 如上图所示. VariableABCDEFGCorrelations (Structure)CY1_1CY2_1CX1_1 0.5154 0.6511 0.5134 0.3688 0.9098 0.3673 0.1974 0.9461 0.1966 0.5806 0.0499 0.5783 0.0143 0.1089 0.0144 -0.5517 0.7635 -0.5539 -0.0221 0.9660 -0.0222CX2_1 0.6327 0.8841 0.9194 0.0485 0.1121 0.7856 0.9941
7
典型相关结构分别是各组原始变量与典型变量两两之间的相关系数矩阵。如上图所示.
Std Canonical Y CoefficientsVariableCY1_1CY2_1A 1.383369 -0.475887B 1.182207 0.231667C -2.113191 1.168151D 0.461724 -0.121811 Std Canonical X CoefficientsVariableCX1_1CX2_1E -0.357076 0.099199F -1.875731 -0.038529G 1.522716 1.025239 输出结果中还给出标准化变量的典型变量系数,如上图所示。
CY1=1.383369+1.182207-2.113191+0.461724 CY1代表房屋和土木建筑业,建筑安装业,其他建筑业,建筑装饰业 (既按行业分8个城市的建筑业总产值)
CY2=-0.475887+0.231667+1.168151-0.121811
CX1=-0.357706-1.875731+1.522716 CX代表内资企业建筑业总产值,港澳台商投资企业建筑业总产值,外商投资企业建筑业总产值(既按登记注册类型分8个城市的建筑业总产值)
CX2=0.099199-0.038529+1.025239
1 2Std Variance (Y Variables)Explained by CY's Explained by CX'sProportionCumulativeCanRsqProportionCumulative0.19440.1944 0.9920410.19290.19290.53730.7317 0.9443080.50740.7002 1 2Std Variance (X Variables)Explained by CY's Explained by CX'sProportionCumulativeCanRsqProportionCumulative0.10170.1017 0.9920410.10250.10250.50930.6110 0.9443080.53930.6418 典型冗余分析(canonical redundancy analysis)表明,两对典型变量仍不能全面预测配对的那组变量。
所得结果: 来自按登记注册类型分8个城市的建筑业总产值的标准方差被对方两个典型变量(CY1、CY2)解释的累积方差比例为61.10%业分8个城市的建筑业总产值的标准方差被对方两个典型变量(CX1、CX2)解释的累积方差比例为70.02%. 如上图所示.
8
第八章 聚类分析与判别分析
The SAS System 16:44 Monday, December 19, 2011 1 The CLUSTER Procedure
Ward's Minimum Variance Cluster Analysis
Eigenvalues of the Correlation Matrix
Eigenvalue Difference Proportion Cumulative 1 5.12605463 3.54016404 0.5696 0.5696 2 1.58589059 0.26678948 0.1762 0.7458 3 1.31910111 0.75532314 0.1466 0.8923 4 0.56377798 0.18843946 0.0626 0.9550 5 0.37533852 0.35456638 0.0417 0.9967 6 0.02077214 0.01170710 0.0023 0.9990 7 0.00906504 0.00906504 0.0010 1.0000 8 0.00000000 0.00000000 0.0000 1.0000 9 -.00000000 -0.0000 1.0000 The data have been standardized to mean 0 and variance 1 Root-Mean-Square Total-Sample Standard Deviation = 1 Root-Mean-Square Distance Between Observations = 4.242641 Cluster History
NCL --Clusters Joined--- FREQ SPRSQ RSQ PSF PST2 7 OB7 OB8 2 0.0144 .986 11.4 . 6 OB5 CL7 3 0.0382 .947 7.2 2.7 5 CL6 OB6 4 0.0735 .874 5.2 2.8 4 OB2 OB3 2 0.0902 .784 4.8 . 3 OB4 CL5 5 0.1309 .653 4.7 3.1 2 OB1 CL4 3 0.1589 .494 5.9 1.8 1 CL2 CL3 8 0.4939 .00
9
T i e
注:为了进行系统聚类并产生帮助确定类数的统计量,使用如下代码: proc cluster data = mylib.nm10 standard method = ward outtree = otree pseudo; run;
结果中首先给出数据相关系数矩阵特征值方面的信息。结果的最后部分为聚类分析的完整过程(Cluster History),如上图所示,内容按列划分从左到右依次为:“NCL”为类别数量,表示新类别形成后类别的总数;
“--Clusters Joined---”为合并的类别,指明这一步合并了哪两个类,有两列。其中OBxxx表示某一个原始样品,而CLxxx表示在某一个聚类水平上产生的类。 “FREQ”表示这次合并得到的类有多少个样品。
“SPRSQ”是半偏R2,“RSQ”是R2,“PSF”为伪F统计量,“PST2”为伪t2统计量.
个人总结
一个学期的
SAS的学习说长不长说短不短,在此期间我认识
到了SAS的实用性。SAS 系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。
SAS 系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、 SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外, SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计
10
要求。
SAS 是由大型机系统发展而来,其核心操作方式就是程序驱动,经过多年的发展,现在已成为一套完整的计算机语言,其用户界面也充分体现了这一特点:它采用MDI (多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。使用程序方式,用户可以完成所有需要做的工作,包括统计分析、预测、建模和模拟抽样等。
从上述案例可的得知,SAS是一个实用性强、功能完善、使用方便、的计算机软件系统。 它不仅具有一般数据管理系统的功能,还提供了一个完善的可编程语言环境,特别是以标准过程给出了常用的数据处理和复杂计算的算法。
11
正在阅读:
sas课程设计论文01-29
等腰三角形动点答案 206-25
1996年 李登辉的就职演说 全文05-28
飘扬的五星红旗作文400字06-27
肠易激综合征的诊断和治疗04-22
电子政务信息安全监控预警平台建设方案04-11
格兰仕集团成本战略管理案例(1)05-06
白色让我想起……作文400字02-04
2005销售与收款循环审计案例05-13
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 课程
- 论文
- 设计
- sas
- CiscoWAN-A
- 东财题库 货币银行学
- 2015高考生物试题分章分类汇编考点解析 - 图文
- 电销总结
- sysctl参数大全--kernel 2.6.18-92.el5
- 第二节课+笔记
- kids - story - 2B
- 校兴我荣校衰我耻教师演讲稿
- 中国MEMS传感器生产规模分析调研
- 上海大学 机械设计(1)模拟试题集,最新
- 高三生物二轮特训:《人和动物生命活动的调节》同步训练及答案
- 节能减排、绿色施工、工艺创新措施
- 厦门大学广告学考研1999-2012真题
- 江西省上饶县中学2015-2016学年高一上学期第十七周周练英语试题
- 零售业发展的历史和变迁
- 国际商法期末复习题及答案
- 不差钱台词 春晚小品不差钱剧本完整台词
- CISP考试2016年专用题库
- 教育部教学指导委员会名单
- 中国铁路电气化线路器材市场运行态势调研及投资前景预测报告