SAS论文_统计分析与应用
更新时间:2023-03-28 19:39:01 阅读量: 政务民生 文档下载
- SAS论文推荐度:
- 相关推荐
SAS
统计分析与应用
学号:xxxxxxxx
班级:xxx
姓名: xxx
word文档可自由复制编辑
目录
第一章摘要 (2)
第二章:基本介绍 (3)
2.1 研究目的 (4)
2.2 采用方法 (4)
2.3 理论知识 (4)
第三章数据预处理及具体模型 (4)
3.1 建立的数据集 (4)
3.2 主要程序. (4)
第四章计算结果及分析 (4)
4.1 使用INSIGHT 模块做主成分分析的步骤 (7)
4.2 主成分的结果分析 (7)
第五章总结分析 (8)
第六章参考文献 (8)
第七章附录 (9)
word文档可自由复制编辑
摘要
SAS 系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。
本次论文是用SAS 系统对2007 各地区农村居民家庭平均每人现金现金支出状况进行分析采用的数据是北京、天津等省农村居民家庭平均每人现金现金支出状(原始数据见附录)。
选出31省的情况作为统计分析数据,其中分析的项目为:期内现金支出、生产费用支出、家庭经营费用支出、农业生产支出、牧业生产支出、购买生产性固定资产支出、税费支出、生活消费现金支出、财产性支出、转移性支出,次用变量X1、X2、X3、X4、X5、X6、X7、X8、X9 、X10。运用SAS 软件,运用主成分分析的方法对数据进行处理:
(一)对于所选取的统计数据用MEANS 过程进行简单描述统计分析,得出数据平均值、数据标准差等。
(二)对于所选取的统计数据用INSIGHT 模块做主成分分析计算协方差矩阵的特征值或是计算相关系数矩阵的特征值(Eigenvalue )、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。
(三)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、第二主成分以及第三主成分的得分。从以上结论分析可以知道影响各地区地区农村居民家庭平均每人现金支出的主要因素,从、可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。
关键字: 主成分分析、简单统计量、相关系数矩阵、相关系数矩阵的特征值及特征向量。
word文档可自由复制编辑
二、基本介绍
1、研究目的:通过SAS 软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素有一个大致的了解;有利于国家的宏观调控,从而可以促进全民经济更好的发展。
2、采用方法:
①描述统计量:MEANS
②检验:使用INSIGHT 模块主成分分析。
3、理论知识:
①MEANS 过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.proc means过程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、Std Dev(数据标准差)、Minimum (最小值)、Maximum(最大值)五种统计值,但means 过程可计算16 种统计量。
②主成份分析(Principal Components Analysis)是研究如何将多个变量指标间的问题化为较少的几个新指标问题。这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于揭示变量间的共线性。
三、数据预处理及具体模型:
对于数据较少的程序可以用DA TA 步创建永久SAS数据集。永久SAS 数据集,由定义逻辑库与定义数据集两个步骤完成。逻辑库定义通过
LIBNAME 语句完成,数据集定义应用DA TA 实现。
LIBNAME 语句语法格式:
LIBNAME 逻辑库名称, 子目录路径' ;
DA TA 语句语法格式:
DA TA 逻辑库名.数据集名称;
LIBNAME 语句把磁盘中的子目录与用户定义的逻辑库名连接起来。
用此种方法根据已知的数据就可以建立生成以下的数据集
3.1 建成的数据集为:
The SAS System 20:00 Tuesday, December 15, 2009
Obs area x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1 北京5318.9 730.
2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2
2 天津3267.8 1242.8 1172.9 203.
3 699.5 69.9 1.2 1896.1 6.0 121.6
3 河北2289.6 779.6 725.0 362.7 226.2 54.6 3.1 1361.7 14.9 130.3
4 山西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1
5 内蒙古3338.7 1426.9 1223.5 865.7 316.
6 203.3 1.
7 1617.3 52.2 240.6
6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.
7 38.7 408.9
7 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7 word文档可自由复制编辑
8 黑龙江4424.6 2047.0 1812.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9
9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6
10 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7
11 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1
12 安徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9
13 福建3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8
14 江西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2
15 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3
16 河南2163.8 583.9 523.9 237.1 228.8 60.0 0.6 1448.6 1.4 129.3
17 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8
18 湖南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5
19 广东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0
20 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6
21 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1
22 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5
23 四川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1
24 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6
25 云南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9
26 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5
27 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9
28 甘肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7
29 青海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3
30 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8
31 新疆2705.0 1444.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2
3.2、模型的具体程序:
data data1;
input area $ 1-6 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ;
cards;
1 北京5318.9 730.
2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2
2 天津3267.8 1242.8 1172.9 203.
3 699.5 69.9 1.2 1896.1 6.0 121.6
3 河北2289.6 779.6 725.0 362.7 226.2 54.6 3.1 1361.7 14.9 130.3
4 山西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1
5 内蒙古3338.7 1426.9 1223.5 865.7 316.
6 203.3 1.
7 1617.3 52.2 240.6
6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.
7 38.7 408.9
7 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7
8 黑龙江4424.6 2047.0 1812.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9
9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6
10 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7
11 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1
12 安徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9
13 福建3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8
14 江西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2
15 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 word文档可自由复制编辑
16 河南2163.8 583.9 523.9 237.1 228.8 60.0 0.6 1448.6 1.4 129.3
17 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8
18 湖南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5
19 广东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0
20 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6
21 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1
22 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5
23 四川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1
24 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6
25 云南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9
26 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5
27 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9
28 甘肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7
29 青海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3
30 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8
31 新疆2705.0 1444.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2
run;
proc print;
run;
四、运行结果及分析
1. 使用INSIGHT 模块做主成分分析的步骤
使用INSIGHT 模块做主成分分析的步骤如下:
1) 在INSIGHT模块中打开数据集L.jjzb;选择菜单“Analyze”?“Multivariate(Y X)(多元分析)”,打开“Multivariate(Y X)”对话框;
2) 将做主成分分析的变量x 1~x10为Y 变量,将变量area 选为Label 变量。
3) 单击“Method”按钮,在打开的对话框中可以选择计算协方差矩阵的特征值或是计算相关系数矩阵的特征值。系统默认计算相关系数矩阵的特征值和特征向量,单击“OK”按钮返回。
图1
图2
word文档可自由复制编辑
图
3
4)单击“Output”按钮,在打开的对话框中包括“Descriptive Statistics”选项、“Bivariate
5)Plots”选项以及各种多元分析的选项。选中“Principal
ComponentAnalysis”复选框,单击下面的“Principal Component Options”按钮,打开“Principal Component Options”对话框,选中“Eigenvectors”复选框,取“Correlations(Structure)”
复选框。
2. 主成分的结果分析
输出的数字分析结果有4 个部分:简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。
图4
图5
word文档可自由复制编辑
图6
五、结果分析
通过用主成分分析的方法对给定的2007年上半年的各地区农村居民家庭平均每人现金支出数据的分析,可以知道影响各地区农村居民家庭平均每人现金支出的主要因素是影响各地区农村居民家庭平均每人现金支出的主要因素是期内现金现金支出、工资性现金支出、财产性现金支出和转移性现金支出;其次是家庭经营现金支出、农业现金支出和牧业现金支出,最后是林业现金支出和渔业现金支出,知道这些主要因素的影响,可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。
六、参考文献
[1]黄燕,SAS 统计分析及应用.机械工业出版社.2006
[2]何宁.统计分析系统SAS.武汉大学出版.2005
[3]薛富.SAS8.2 统计应用教程.北京希望电子出版社2007
word文档可自由复制编辑
七、附录:
地区农村居民家庭平均每人现金支出(2009年上半年)
单位:元期内
现金生产税费生活财产
性转移性
地区支出费用家庭购买生支出消费支出支出支出经营农业牧业产性固现金
费用生产生产定资产支出
支出支出支出支出
合计2631 777.4 678.2 348.3 231.3 99.2 3.4 1633.8 22.9 193.6
北京5318.9 730.2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2 天津3267.8 1242.8 1172.9 203.3 699.5 69.9 1.2 1896.1 6 121.6
河北2289.6 779.6 725 362.7 226.2 54.6 3.1 1361.7 14.9 130.3 山西2080.9 500 441.3 254.4 126.3 58.7 0.7 1431.2 4 145.1 内蒙古3338.7 1426.9 1223.5 865.7 316.6 203.3 1.7 1617.3 52.2 240.6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125 3.8 1803.7 38.7 408.9 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741 202.9 438.7 黑龙江4424.6 2047 1812.2 1405 368.8 234.8 2.9 1699.1 301.8 373.9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1 安徽2390 554.9 490.7 297.2 116.7 64.2 6 1666.2 3 159.9 福建3026 626.4 566.8 251 208.1 59.6 0.7 2168.2 10.8 219.8 江西2199.8 680.6 591.7 339.7 160.4 89 4.5 1328 23.5 163.2 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 河南2163.8 583.9 523.9 237.1 228.8 60 0.6 1448.6 1.4 129.3 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8 湖南2418.9 555.8 497.8 196.7 175.2 58 3.8 1587.9 2.8 268.5 广东2895.2 576.3 547.4 171.3 216.3 29 1.7 2155.6 9.5 152 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5 四川2514.5 612.8 533.5 178 270.7 79.3 6.1 1669.5 7 219.1 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1 171.6 云南1837.1 623 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9 甘肃1622.3 473.2 391.2 298.3 74.4 82 0.9 1068.2 4.3 75.7
word文档可自由复制编辑
青海1753.8 447.9 348 190.1 92.5 99.8 1.7 1196.5 7.4 100.3 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8 新疆2705 1444.4 1109.7 813.2 236.6 334.7 1 1126 44.4 89.2
word文档可自由复制编辑
正在阅读:
SAS论文_统计分析与应用03-28
我的奇思妙想作文350字06-24
2012年第三期铁路监理工程师业务培训考试合格人员名单03-14
蒙特卡罗方法与MCNP程序入门04-27
关于的西湖作文500字07-03
团委书记考察三年工作总结范文09-07
第4-12届小学“希望杯”全国数学邀请赛六年级1试 - 图文01-13
我最爱的唐诗作文06-24
- 龙湖地产运营管理体系介绍报告
- 儿童文学教案(上)71]
- 人大代表述职报告格式
- 开鲁二小工会第九届委员会选举大会表决办法
- 2015年高考真题——文科综合(浙江卷) Word版含答案
- 健康知识趣味问答题
- 八年级英语下册Unit1Willpeoplehaverobots教案1人教新目标版
- 新疆大学助学金
- 装配式大板多层住宅楼工程施工组织设计
- 橡胶热老化的几种测试方法
- 首都师范大学 自然科学基金申请项目同行专家通讯评审意见
- 杭州中考体育政策及考试项目评分标准新
- 长链非编码RNA与肿瘤的相关研究进展
- 逆回购_百度百科
- 微信支付服务协议 电签协议
- 读科学发展观有感
- 钢筋试验及取样标准
- 控辍保学工作措施
- 高二(下)期末语文试卷-(含答案)
- 10Gb、s0.18_mCMOS限幅放大器
- 统计分析
- 应用
- 论文
- SAS