非参数统计检验方法的应用

更新时间:2023-11-06 22:05:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

论文投稿领域:数理经济与计量经济学

非参数统计检验方法的应用

1 1 2

阮曙芬程娇翼张振中

(1.中国地质大学数理学院,武汉 430074;2.中南大学数学科学与计算学院,长沙 410075)

摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用

Kruskal-Wallis检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。 关键字:符号检验;Wilcoxon秩和检验;Kruskal-Wallis检验

1引言

非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon秩和检验和Kruskal-Wallis检验,然后结合具体的问题和数据,在统计软件SAS中作相应的非参数检验。

2非参数假设检验介绍

2.1 配对样本的符号检验

符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。

设随机变量X1,X2,...,Xn相互独立同分布,分布为F(x),F(x)在x?0连续。假设检验问题

H0:F(0)?12 H1:F(0)?12 检验统计量可取B???i???(Xi),即为X1,X2,...,Xn中取正号的个数。在H0下,B的分i?1i?1nn1布是参数为n和1/2的二项分布b(n,)。 22.2 两独立样本的Wilcoxon秩和检验

Wilcoxon秩和检验的理论背景如下:有两个总体,一个总体的样本为X1,X2,...,Xn,相互独立同分布,分布为F(x);另一个样本为Y1,Y2,...,Yn,相互独立同分布,分布为G(x),F(x),

G(x)连续。问随机变量Y是否随机大于随机变量X,即检验

H0:F(x)?G(x),H1:F(x)?G(x),且有某些点不等号成立。

将X1,X2,...,Xn,Y1,Y2,...,Yn共m?n个随机变量一起排序,产生对应的秩

R?(Q1,...,Qm;R1,...,Rn)。则Wilcoxon秩和检验统计量为:W??Ri即Y1,Y2,...,Yn在混合样

i?1n本中的秩的和为Wilcoxon秩和检验统计量。 2.3多样本的Kruskal-Wallis检验

Kruskal-Wallis检验一般对多个总体的分布情况进行检验。其理论基础为:假设有m种处理,对于第j个检验体实行第i种处理产生的效果记为xij,其分布函数为Fi(x)。即

H0:F1(x)?F2(x)?...?Fn(x);H1:存在i和i',Fi(x)?Fi'(x)。

设观测值为{xij,i?1,2,...,m;j?1,2,...,n}。全体样本数为N,xij的顺位记为rij。假定同顺位不会出现。考虑统计量: 2k?12N(N?1)?1ni[ri??niN?12]?12N(N?1)?ri?ni?3(N?1) 2i?1i?1mm检验方法为:k?kN?拒绝H0,k?kN?不拒绝H0。

其中,?=P{k?kNH0}。当(n1,n2,...,nm)较小时,可以查表得到?的值;当该值较大时,22(m?1),kN???(m?1)为自由度为m?1的?2k近似服从自由度为m?1的?2分布。因此??分布的右侧的?分位数点。

3 Kruskal-Wallis检验的应用

股市的周末效应是指周一的收益率比其他交易日收益率低,且风险较大;周五的收益率

比其他交易日高,且相对风险较小。下面分别对2002年的前三季度的上证综合指数进行周末效应的分析。

本实证分析中,样本为2002年1月4日到2002年9月27日的上海股市综合指数(数据来源于http://stock.sina.com.cn/stock/company/sh000001/20031012.html)。指数收益率的计算公式为:rt?ln(ptpt?1),其中pt为第t天的指数,rt为第t天的指数收益率。 3.1收益率分布状况的分析

首先计算收益率序列的方差,均值,偏度和峰度初步判断该序列是否服从正态分布。然后利用Kolmogorov-Smirnov等检验结果对收益率进行正态性检验。 [SAS程序]

创建数据集:将excel数据导入SAS中,然后在分析家中利用数据计算得到: r0=p/lag1(p)和r=log(r0);

data sasuser.chx1 sasuser.chx2 sasuser.chx3 sasuser.chx4 sasuser.chx5; set sasuser.ch01; select (w);

when(1) output sasuser.chx1; when(2) output sasuser.chx2; when(3) output sasuser.chx3; when(4) output sasuser.chx4; when(5) output sasuser.chx5; end; run;

proc univariate data=sasuser.ch01; var r; run;

[SAS结果输出]见表1汇总

表1 上证指数收益率描述性统计分析 星期 均值 t统计量 自由度 方差 偏度 峰度 周一 -3.882 E-3 周二 周三 周四 周五 -3.423 E-3 全体数据 -0.110 E-3 4.875 E-3 0.422 E-3 1.363 E-3 -1.2681.3990.1800.423-1.776-0.084(0.214) (0.171) (0.858) (0.675) (0.085) (0.933) 34 -1.069 3.666 34 2.292 7.850 34 2.696 12.433 34 0.992 3.646 33 -0.630 0.389 169 1.144 7.084 0.319 E-3 0.413 E-3 0.186 E-3 0.352 E-3 0.123 E-3 0.283 E-3 由上表可知,上证指数收益率序列的偏度和峰度分别为1.144和 7.084,而正态分布的偏度和峰度分别为0和3,所以我们可以初步断定指数收益率序列为非正态分布。为了进一步证实这一论断,我们对收益率序列进行Kolmogorov-Smirnov检验。SAS自动输出包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量。 [SAS程序] proc univariate data=sasuser.chx1 normal; var r; histogram r; probplot r; run; [SAS结果输出]见表1汇总,图1和图2。 表2 上证指数收益率的正态性检验 Kolmogorov-Smirnov检验对应的p值 Shapino-Wilk 检验对应p值 Cramer-von Mises检验对应的p值 Anderson-Darling检验对应的p值 周一 周二 周三 周四 周五 全体 数据 自由度 0.0464 <0.0100 <0.0100 0.0910 0.1500 <0.0100 0.0106 <0.0001 <0.0001 0.0126 0.1010 <0.0001 0.0272 <0.0050 <0.0050 0.0164 0.1528 <0.0050 0.0211 <0.0050 <0.0050 0.0172 0.0962 <0.0050 34 34 34 34 33 169 6050Percent403020100-0.06-0.04-0.02r00.020.04 图1 上证综合指数收益率分布的直方图

0.040.020r-0.02-0.04-0.06-0.0815102550Normal Percentiles75909599 图2 上证综合指数收益率分布的概率图

包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量均表明上海综合指数收益率序列不服从正态分布,图1和图2也说明了这一点。所以要采用非参数方法进行以后的周末效应的检验。

3.2周末效应存在性的Kruskal-Wallis检验

我们利用Kruskal-Wallis检验2002年前三季度上证综合指数收益率的周末效应的存在性。

[SAS程序]

proc npar1way wilcoxon data=sasuser.ch01; class w; var r; run;

[SAS结果输出]

-------------------------------------------------------------------------

The NPAR1WAY Procedure

Wilcoxon Scores (Rank Sums) for Variable r

Classified by Variable w

w N Sum of Scores Expected Under H0 Std Dev Under H0 Mean Score 5 33 2576.0 2805.0 252.150749 78.060606

1 34 2610.0 2890.0 255.000000 76.764706 2 34 3206.0 2890.0 255.000000 94.294118 3 34 2996.0 2890.0 255.000000 88.117647 4 34 2977.0 2890.0 255.000000 87.558824

Kruskal-Wallis Test Chi-Square 3.0846 DF 4 Pr > Chi-Square 0.5438

------------------------------------------------------------------------- K-W检验得?=3.086,df=4,p=0.5348?0.05,所以不能拒绝H0,即周一到周五得上证综合指数收益率得分布F1(x)?F2(x)?...?F5(x),所以我们认为在2002年的前三季度中,上海市股市综合指数收益率不存在周末效应。

2

参考文献:

[1] Damodar N. Gujarati. Basic Econometrics.北京:中国人民大学出版社,2005. p791-p800. [2] George E. P. Box, Gwilym M. Jenkins, Gregory C. Reinsel. Time Series Analysis

Forecasting And Control.

[3] 何书元. 应用时间序列分析. 北京:北京大学出版社, 2003. p218-p226. [4] 张卓. SAS软件的应用. 统计与信息论坛(2005),Vol.20, No.4. p104-p106. [5] 樊欣,邵谦谦.SAS 8.X 经济统计.北京:北京希望电子出版社,2003. p28-p60.

[6] 岳朝龙,黄永兴,严钟. SAS系统与经济统计分析. 合肥:中国科学技术大学出版社, 2004. p469-p487 [7] 李彦萍.发达与非发达地区收入与消费非参数统计分析.山西农业大学学报(2005),Vol.4, No.4.

p334-p339.

[8] 刘彤.利用非参数方法对上海股市周末效应的研究.数理统计与管理(2003),Vol.22,No.1.

p69-p71.

Application of Nonparametric statistical Method

RUAN Shu-fen,CHENG Jiao-yi,ZHANG Zhen-zhong

(School of Mathematics and Physics, China University of Geosciences, Wuhan 430074) Abstract: In this paper, we simply introduce three common hypothesis tests. Using the Kruskal- -Wallis test, we do week effect test about the shanghai synthetic index of which we take the first three quarters of 2002 for samples. Showing that during the year of 2002, the yield of shanghai stock market synthetic index has no week effect.

Keywords: singed test; wilcoxon rank sum test; Krtuskal-wallis test.

本文来源:https://www.bwwdw.com/article/95g2.html

Top