第8章 非参数统计法 - 图文

更新时间:2024-07-05 08:07:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第八章非参数统计方法nonparametric test温州医学院环境与公共卫生学院叶晓蕾1变量类型定量变量等级变量单样本资料两组比较正态分布??多组比较nono无序分类变量非参数统计法(秩和检验)单因素方差分析Yes单样本t检验Yes方差齐??Yest检验方差分析配对t检验两因素方差分析析因方差分析,等成组t检验2一、基本概念(一)非参数统计不依赖于总体分布形式,不须考虑被研究对象为何种分布及分布是否已知,不是参数间的比较,而是用于分布之间的比较。(二)参数统计依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。3(三) 两类统计方法的优缺点:参数统计——检验效率较高,但使用条件较严格。非参数统计——由于对资料无特殊要求,因此适用范围广,资料收集和分析比较简便。但统计效率较低(β较大)。?选择:首先考虑参数检验,当条件不符,才选择非参数统计方法。4(四) 非参数统计适用情况(1)偏态分布资料(2)总体分布不明资料定量变量(3)方差不齐资料(4)数据一端或两端有未确定值(5)等级资料5

二、秩和检验(rank sum test)是非参数检验中效率较高,而且比较系统完整的一种。两组资料比较配对设计——Wilcoxox signed rank test成组设计——Wilcoxon Mann-Whitney test多组资料比较完全随机设计——Kruskal-Wallis H test随机区组设计——Friedman Mtest 6(一)配对资料比较—符号秩和检验表1.2 两种方法尿铁蛋白(ug /L)结果 对象号 A法 B法 差值d 秩 1 30.6 30.6 0 -- 2 59.9 63.1 -3.2 -3 3 46.0 58.0 -12.0 -6 4 23.0 10.9 12.1 7 5 20.3 33.7 -13.4 -9.5 6 48.6 99.5 -50.9 -11 7 25.0 24.4 0.6 1 8 23.4 36.2 -12.8 -8 9 44.1 45.2 -1.1 -2 10 399.8 404.1 -4.3 -4 11 25.9 39.3 -13.4 -9.5 12 535.6 544.8 -9.2 -5 T-=58 T+=8?为什么要用非参数检验?SPSS7StatisticsdNValid12Missing0Skewness-1.920Std. Error of Skewness.637Kurtosis5.640Std. Error of Kurtosis1.232u??1.9210.637?3.01 p?0.01u5.642?1.232?4.58 P?0.018基本步骤:(1)建立检验假设,确定检验水准:H0:差值的总体中位数为0;即Md=0 H1:差值的总体中位数不为0。即Md≠0 α=0.05(2)求检验统计量T:求差值: 编秩:按差值的绝对值从小到大编秩。差值为0,舍去不记,n相应减少;差值绝对值相同,取平均秩次。求秩和并确定检验统计量: T+、T-,两者均可作为检验统计量。(3)确定P,作出统计推断结论9结果判断:(1)查表法:当n<50时,查T界值表(符号秩和检验用)(P.716),得:T0.05,11= 10~56,(T0.01, 11= 5~61)若T+或T-:落在范围内,则P>0.05;落在范围外, 则P<0.05;等于界值, 则P=0.05。10

(2)正态近似法:若n>50时, 可近似认为T分布逼近正态分布。u 检验的公式为:u?T?n?n?1?/4?0?5n?n?1??2n?1?/24如果相同秩次较多,则需要进行校正,校正公式为:u?T?n?n?1?/4?0?5n?n?1??2n?1????t3j?tj?244811Wilcoxon Signed Ranks TestRanksNMean RankSum of Ranksb - aNegative Ranks2a4.008.00Positive Ranks9b6.4458.00Ties1cTotal12a. b < ab. b > ac. b = aTest Statisticsbb - aZ-2.224aAsymp. Sig. (2-tailed).026a. Based on negative ranks.b. Wilcoxon Signed Ranks Test124.2 配对比较两种方法治疗扁平足效果记录如下,问那种方法好? 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 甲法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 乙法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差 差值 2 0 2 1 - 1 1 1 2 0 0 0 0 1 1 1 1秩次 10 10 4.5 -4.5 4.5 4.5 10 4.5 4.5 4.5 4.5T+ = 61. 5,T- = 4. 5查表得: T0.05, 11= 10~56,T0.01, 11= 5~61P < 0.01SPSS14(二)成组设计两样本比较—Wilcoxon Mann-Whitney test基本思想方法:总体分布函数:样本例数:混合编秩:分组求秩和:取检验统计量:确定概率P:f(x)f(y)↓↓n1≤ n2秩号为1,2,……(n1+ n2)T1T2T=T1当n1≤10,n2-n1≤10 时,查P.717。n1>10,n2-n1>10 时,计算u值。当15正态近似法:当超过附表10的范围时(n1>10, n2-n1>10)u检验公式为:u?T?n1?N?1?/2?0?5n1n2?N?1?/12相同秩次较多时,需要校正:u?T?n1?N?1?/2?0?5n1n2312N?N?1??N?N???t3j?tj??16

(一) 原始数据两组比较: 例某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白值(ug/L)如下表。因难以确定数据分布情况,故决定用秩和检验。两组人群血铁蛋白测定结果 肺炎患者 31 68 237 174 457 492 199 515 599 238 正常人 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95 患者组:均数为301,标准差为199正常组:均数为101,标准差为8517T=183.5,n1=10,n2-n1=6 ,查表得:0.01<P<0.02SPSS18RanksgroupNMean RankSum of Ranksx11018.35183.5021610.47167.50Total26Test StatisticsbxMann-Whitney U31.500Wilcoxon W167.500Z-2.559Asymp. Sig. (2-tailed).011Exact Sig. [2*(1-tailed Sig.)].009aa. Not corrected for ties.b. Grouping Variable: group19(二) 等级资料或频数表资料两组比较问铅作业工人尿棕色素是否高于正常人?u=4.493,P < 0.0005故铅作业工人尿棕色素(1070/32=33.4)高于正常人(308/20=15.4)。20SPSSMann-Whitney TestRanks处理NMean RankSum of Ranks结果正常人2015.40308.00患者3233.441070.00Total52Test Statisticsa结果Mann-Whitney U98.000Wilcoxon W308.000Z-4.503Asymp. Sig. (2-tailed).000a. Grouping Variable: 处理21

四.完全随机设计多组资料比较——Kruskal-Wallis testR12H??3(N?1)?N(N?1)ni查表确定P值:(1)若组数k = 3,且每组例数ni?5时,查H界值表(P.718)。(2)若超过H界值表范围,如k > 3 或ni> 5, 此时H分布近似服从自由度为k-1的X2分布。(3)若相同秩次较多,需对H值校正:?tjHHC? C?1?3CN?N2i??3tj?22(一)原始资料多组比较例11.3 为研究吸烟与尿中硫氰酸盐含量的关系,某医生收集了下述数据,问不同吸烟量者尿中的硫氰酸盐有无差别?表11.3 不同吸烟量者尿中硫氰酸盐(mg/L)不吸烟1~2支/天3~10支/天>10支/天2.86.05.22.52.54.51.98.83.71.37.97.50.405.220.82.80.410.311.32.81.35.618.50.82.53.95.61.33.76.612.52.57.07.507.07.503.73.76.616.79.810.89.811.6ni 1281314R 144.5105.5381.5496.5232R12iH??3(N?1)?N(N?1)ni12144.5496.5?(???)?3(47?1)?25.8747(47?1)1214本例k=4,?=4 –1=3,X20.01(3)=11.34,22H>11.34,所以P <0.01。可认为不同吸烟量者尿中的硫氰酸盐有差别。SPSSRanksgroup1234TotalN128131447Mean Rank12.0413.1929.3535.46Test Statisticsa,bx25.9293.000a. Kruskal Wallis Testb. Grouping Variable: groupxChi-SquaredfAsymp. Sig.24(二)等级资料或频数表资料的多组比较例某医师为研究早产、足月产及过期产者在产后一个月内泌乳量的差别,收集了如下资料,问三种产妇乳量有无差别?SPSS25五. 随机区组设计多组资料比较——Friedman M test例欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将4名学生分为一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?26

本文来源:https://www.bwwdw.com/article/0ye.html

Top