实验二数据预处理及时序图绘制
更新时间:2024-06-30 01:38:01 阅读量: 综合文库 文档下载
- 时序序列数据预处理推荐度:
- 相关推荐
实验二 数据预处理及时序图绘制
一、实验目的:了解GPLOT过程的使用,利用GPLOT绘制时序图并对时序图进行分析。了解ARIMA过程的使用,利用ARIMA进行平稳性分析及纯随机性检验。 二、实验内容
(1)Gplot过程
生成高分辨率图形的PROC GPLOT过程的一般使用格式如下:
Porc Gplot DATA=数据集 ;
Plot 纵坐标变量Y*横坐标变量X……选项列表>; Symboln <选项列表> ; Axisn <选项列表> ; Run ;
使用PROC GPLOT过程和PROC PLOT过程的区别是,对于PROC GPLOT语句,PROC PLOT语句中的VPCT和HPCT等选项不可使用。两者的PLOT语句使用方法基本相同。最主要的区别是,在PROC GPLOT过程中,可使用SYMBOLn语句和AXISn语句。
SYMBOLn语句的主要作用:可以定义数据点的符号,可以定义数据点之间的连接方式,可以定义数据点和线的颜色。SYMBOLn语句的n取值范围从1到99,缺省值是1,n代表Y*X两个变量形成数据连线的系列数。一些主要选项如下:
? V=数据点图形符号——数据点的符号有NONE(没有)、PLUS(缺省值加号)、STAR
(星号)、SQUAR(小方块)、DIAMOND(小菱形)、TRANGLE(三角形)、CIRCLE(小圆圈)。
? I=数据点间连接方式——常用的连接有NONE(没有)、JOIN(直线)、SPLINE(平
滑)、NEEDLE(从数据点到横坐标画垂直线)、HILOC(最高、最低、收盘价)、RL(直线回归线)、BOX25(盒形线)。 ? W=连线的线宽——例如,w=5。 ? H=图形符号的高度——例如,h=2.5。 ? L=定义连线的类型——例如,l=2。 ? C=定义颜色——例如,c=red。
? FONT=定义一种字体——例如,font=swissb。
SYMBOLn语句所定义的各种选项,由于数量众多,用户一般很难记忆,我们上面所列出的仅仅是一小部分。通常可以在命令输入框中发布SYMBOL命令,调出SYMBOL窗口,在选项参数的横线上键入?后,在参数对话框中选择参数。共有14项参数选项,每项中还有许多参数值。
一个SYMBOLn语句一旦被定义就一直保持有效,直到重新定义或者退出SAS系统。执行一个不带任何选项的SYMBOLn语句将取消SYMBOLn的全部定义,并不影响其他的SYMBOL语句。如果想要取消所有的SYMBOL语句定义,提交下面的语句:
goptions reset=symbol ;
2.1975-1980年夏威夷岛莫那罗亚火山(Mauna loa)每月释放的co2数据如下(单位:ppm),见表2-7.
330.45 331.9 331.63 333.05 332.81 334.65 334.66 336.25 335.89 337.41 337.81
330.97 330.05 332.46 330.87 333.23 332.41 335.07 334.39 336.44 335.71 338.16
331.64 328.58 333.36 329.24 334.55 331.32 336.33 332.44 337.63 333.68 339.88
332.87 328.31 334.45 328.87 335.82 330.73 337.39 332.25 338.54 333.69 340.57
333.61 329.41 334.82 330.18 336.44 332.05 337.65 333.59 339.06 335.05 341.19 337.74
333.55 330.63 334.32 331.5 335.99 333.53 337.57 334.76 338.95 336.53 340.87 338.36
339.25 337.19 335.49 336.63
(1) 绘制序列时序图,并判断该系列是否平稳。 data example2_1; input price@@;
time=intnx('month','01jan1975'd,_n_-1); format time date.; cards;
330.45 330.97 331.64 332.87 333.61 333.55 331.90 330.05 328.58 328.31 329.41 330.63 331.63 332.46 333.36 334.45 334.82 334.32 333.05 330.87 329.24 328.87 330.18 331.50 332.81 333.23 334.55 335.82 336.44 335.99 334.65 332.41 331.32 330.73 332.05 333.53 334.66 335.07 336.33 337.39 337.65 337.57 336.25 334.39 332.44 332.25 333.59 334.76 335.89 336.44 337.63 338.54 339.06 338.95 337.41 335.71 333.68 333.69 335.05 336.53 337.81 338.16 339.88 340.57 341.19 340.87 339.25 337.19 335.49 336.63 337.74 338.36
; proc gplot data=example2_1; plot price*time=1; symbol1 c=black v=star i=join; run; price34234134033933833733633533433333233133032932801JAN7501JUL7501JAN7601JUL7601JAN7701JUL7701JAN78time01JUL7801JAN7901JUL7901JAN8001JUL8001JAN81时序图给我们的提供的信息非常明确,夏威夷岛莫那罗亚火山(Mauna loa)每月释放的co2时间序列图有明显的递增趋势,所以它不是平稳序列。 ?k(k?1,2,?,24)。 (2)计算该序列的样本自相关系数?data example2_1; input price@@; time=intnx('month','01jan1975'd,_n_-1); format time date.; cards; 330.45 330.97 331.64 332.87 333.61 333.55 331.90 330.05 328.58 328.31 329.41 330.63 331.63 332.46 333.36 334.45 334.82 334.32 333.05 330.87 329.24 328.87 330.18 331.50 332.81 333.23 334.55 335.82 336.44 335.99 334.65 332.41 331.32 330.73 332.05 333.53 334.66 335.07 336.33 337.39 337.65 337.57 336.25 334.39 332.44 332.25 333.59 334.76 335.89 336.44 337.63 338.54 339.06 338.95 337.41 335.71 333.68 333.69 335.05 336.53 337.81 338.16 339.88 340.57 341.19 340.87 339.25 337.19 335.49 336.63 337.74 338.36 ; proc arima data=example2_1; identify var=price; run; Correlation 0.90751 0.72171 0.51252
0.34982 0.2469 0.20309 0.21021 0.26429 0.36433 0.48472 0.58456 0.60198 0.51841 0.36856 0.20671 0.08138 0.00135 -0.03248
(3)绘制该样本自相关图,并解释该图形。
自相关图显示序列子相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,同时自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。自相关图显示出来的这两个性质和该序列时序图显示的带长期递增趋势的周期性质是非常吻合的。 3.1945-1950年费城月度降雨量数据如下(单位:mm)
69.3 80 40.9 74.9 84.6 101.1 225 95.3 100.6 48.3 144.5 28.3 38.4 52.3 68.6 37.1 148.6 218.7 131.6 112.8 81.8 31 47.5 70.1 96.8 61.5 55.6 171.7 220.5 119.4 63.2 181.6 73.9 64.8 166.9 48 137.7 80.5 105.2 89.9 174.8 124 86.4 136.9 31.5 35.3 112.3 43 160.8 97 80.5 62.5 158.2 7.6 165.9 106.7 92.2 63.2 26.2 77 52.3 105.4 144.3 49.5 116.1 54.1 148.6 159.3 85.3 67.3 112.8 59.4
?k(k?1,2,?,24)。 (1) 计算该序列的样本自相关系数?data example2_2; input price@@;
time=intnx('month','01jan1945'd,_n_-1); format time yymmdd10.; cards;
69.3 80 40.9 74.9 84.6 101.1 225 95.3 100.6 48.3 144.5 28.3
38.4 52.3 68.6 37.1 148.6 218.7 131.6 112.8 81.8 31 47.5 70.1
96.8 61.5 55.6 171.7 220.5 119.4 63.2 181.6 73.9 64.8 166.9 48
137.7 80.5 105.2 89.9 174.8 124 86.4 136.9 31.5 35.3 112.3 43
160.8 97 80.5 62.5 158.2 7.6 165.9 106.7 92.2 63.2 26.2 77
52.3 105.4 144.3 49.5 116.1 54.1 148.6 159.3 85.3 67.3 112.8 59.4 ;
proc arima data=example2_2; identify var=price; run;
(2) 判断该序列的平稳性
data example2_2; input price@@;
time=intnx('month','1jan1945'd,_n_-1); format time yymmdd10.; cards;
69.3 80.0 40.9 74.9 84.6 101.1 225.0 95.3 100.6 48.3 144.5 28.3
38.4 52.3 68.6 37.1 148.6 218.7 131.6 112.8 81.8 31.0 47.5 70.1
96.8 61.5 55.6 171.7 220.5 119.4 63.2 181.6 73.9 64.8 166.9 48.0
137.7 80.5 105.2 89.9 174.8 124.0 86.4 136.9 31.5 35.3 112.3 43.0
160.8 97.0 80.5 62.5 158.2 7.6 165.9 106.7 92.2 63.2 26.2 77.0
52.3 105.4 144.3 49.5 116.1 54.1 148.6 159.3 85.3 67.3 112.8 59.4 ;
proc gplot data=example2_2; plot price*time=1;
symbol1 c=black v=star i=join; run;
price30020010001945-01-011946-01-011947-01-011948-01-01time1949-01-011950-01-011951-01-01 该序列的时序图如上,图上可以看出该序列在一个常值附近上下波动,且不具有周期性,判断该序列为平稳序列。
5表2-9数据是某公司在2000-2003年期间每月的销售量。 销售量 2000年 2001年 2002年 2003年
153 134 145 117 1月
187 175 203 178 2月
234 243 189 149 3月
212 227 214 178 4月
300 298 295 248 5月
221 256 220 202 6月
201 237 231 162 7月
175 165 174 135 8月
123 124 119 120 9月
104 106 85 96 10月
85 87 67 90 11月
78 74 75 63 12月
(1) 绘制该序列时序图及样本自相关图。 1.时序图
data example2_3; input price@@;
time=intnx('month','1jan2000'd,_n_-1); format time yymmdd10.; cards; 153 187 234 212 300 221 201 175 123 104 85 78 134 175 243 227 298 256 237 165 124 106 87 74 145 203 189 214 295 220 231 174 119 85 67 75 117 178 149 178 248 202 162 135 120 96 90 63 ;
proc gplot data=example2_3; plot price*time=1;
symbol1 c=black v=star i=join; run; price30020010002000-01-012000-07-012001-01-012001-07-012002-01-01time2002-07-012003-01-012003-07-012004-01-01 2.自相关图 (1) 判断该序列的平稳性
答:该序列在一个常值附近上下波动,但据周期性,因此判定该序列为不平稳序列。 6.1969年1月至1973年9月在芝加哥海德公园内每28天发生的抢包案件表如下
10 15 10 10 12 10 7 7 10 14 8 17 14 18 3 9 11 10 6 12 14 10 25 29 33 33 12 19 16 19 19 12 34 15 36 29 26 21 17 19 13 20 24 12 6 14 6 12 9 11 17 12 8 14 14 12 5 8 10 3 16 8 8 7 12 6 10 8 10 5 (1) 判断该序列{xt}的平稳性及纯随机性 该序列的时序图及自相关图如下:
price4030201002000-01-012001-01-012002-01-012003-01-01time2004-01-012005-01-012006-01-01时序图
自相关图
该序列在一个常值附近上下波动,且不据周期性,且该序列的自相关图显示自相关数在3阶之后,俊落入2倍标准差范围以内,因此判定该序列为平稳序列。 该序列纯随机性检验:
检验结果显示,在各阶延迟下LB检验统计量的P值都非常小(<0.0001),所以可以很大的把握(置信水平>99.999%)判定该序列为非白噪声序列,即非纯随机序列。
(2)对该序列进行函数运算:yt?xt?xt?1并判断序列{yt}的平稳性及纯随机性。 {yt}时序图:
data example2_5; input price@;
time=intnx('month','1jan2000'd,_n_-1); format time yymmdd10.; cards; 19 -7 -17 7 2 15 -12 -10 -3 -5 9 5 0 -9 1 10 0 -7 -5 4 5 -3 -5 4 -2 9 1 -6 -8 0 13 5 -10 -4 2 0 0 0 -4 6 20 -28 -1 5 0 5 -1 -6 -3 20 11 -30 4 19
0 -17 -9 ; proc gplot data=example2_5; plot price*time=1; symbol1 c=black v=star i=join; run; price20100-10-20-302000-01-012000-07-012001-01-012001-07-012002-01-012002-07-012003-01-012003-07-012004-01-012004-07-012005-01-01time自相关图; 自相关图
该序列在一个常值附近上下波动,且不据周期性,且该序列的自相关图显示自相关数在1阶之后,俊落入2倍标准差范围以内,因此判定该序列为平稳序列。 该序列纯随机性检验:
检验结果显示,在各阶延迟下LB检验统计量的P值都非常小(<0.05)所以可以很大的把握判定该序列为非白噪声序列,即非纯随机序列。
实验小结:判断一个序列是否为平稳序列,我们可以通过时序图来判定,平稳的随机序列一定是在一个常值附近上下波动,如果出现周期变换,则不平稳。而该序列是否为白噪声序列可以通过P值来检验。
正在阅读:
实验二数据预处理及时序图绘制06-30
六年级下册第九模块英语复习05-27
便利店员工工作职责04-07
多元统计(操作步骤) - 图文12-18
郑州大学第二次学代会工作报告09-30
铝合金办公室隔断03-08
Android操作系统及应用作业412-19
钢结构展厅施工组织设计05-18
市应急管理局年度工作总结和2022年应急管理宣传工作规划07-30
工程制图 绘图综合技能实验报告答案11-02
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 预处理
- 时序
- 绘制
- 实验
- 数据
- 全国2012年04月自学考试00061《国家税收》历年真题
- 二年级数学下册教学工作总结
- XXX街春季预防和减少严重精神障碍患者肇事肇祸专项行动工作小结
- 关于2011年度全省建筑业企业小型项目管理师培训和统一考试有关事
- 银行内部控制体系建设
- 2016下半年英语教师资格证面试真题(精选) - 图文
- 欧阳询简介及书法成就
- QC小组的基本概念及责任和活动
- 2010福建省C语言模拟题十套(附带答案)
- 中国花园凉篷行业市场前景分析预测年度报告(目录) - 图文
- 某屋顶绿化工程施工组织设计方案
- 江西省重点中学盟校2019届高三第一次联考英语试题 Word版含答案
- 南开大学现代远程教育学院考试卷 2014-2015年度秋季学期期末(201
- 蒙眼作画 人人都认为睁着眼睛画画比闭着眼要画得好
- LTE FR– Fast Return(快速回落)
- 小学信息技术新课程标准试题及部分答案
- 举例说明资产负债表的编制技巧-会计实务之财务报表
- 中山市石岐区一对一家教怎么样?
- 真情铸造师魂
- 轨道工程监理细则(出稿版)