体育科研方法讲义

更新时间:2023-11-02 14:14:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPSS在体育统计中的应用

第一节 数据的整理和收集

做研究的一般程序是:

理论(选题)——假设——概念的操作性定义——选择样本(调查/相关设计访问或问卷)或受试者(实验设计,设计实验组与控制组,并实施观察、访问及问卷调查)—(用第二手资料)—收集数据——分析数据——结果发现

如要研究兰州理工大学学生的体育消费水平,可以先假设兰州理工大学学生的体育消费水平高于兰州市其他高校学生的体育消费水平,并着手整理有关概念和定义,设计问卷进行调查或者直接访问,并收集问卷调查结果和访问内容,同时可借用有关二手资料(如前人的研究成果,有关部门的统计资料),进而分析数据,寻找数据的有关规律,比较兰州理工大学和兰州市大学生体育消费水平的不同或者特征,最后撰写研究过程和结果。

一、数据的来源

原始资料—为了特定的目的和特定要求而专门调查收集,如原始记录(体质测试数)、问卷调查(论文里最常用的一种研究方法)、访谈录(访谈法)、实验结果等等。

第二手资料—现存的他人已经整理分析的资料,如报刊资料、全国各级机构统计公布的资料(中国统计年鉴)、各类调查报告等。

调查一般有以下几种分类:

直接调查方式一般有普查(全国人口普查、国民体质调查)、典型调查、重点调查、抽样调查、网上调查等。

抽样调查:从总体中抽取一部分进行调查,目的是推断总体的特征,是一般研究最常用的方式,具有经济性、时效性强、准确性高的特点。

比较紧跟时代的网上调查具有一定的优越性:及时性和共享性、便捷性和低费用、交互性和充分性、可靠性和客观性、无时空地域限制。

二、数据的搜集

数据的搜集方法包括询问调查和观察实验2种方式。

询问调查:访问调查、邮寄调查、电话调查、座谈会、个别深访、电脑辅助。 访问调查:调查者与被调查者通过面对面地交谈而获得资料,标准式访问通常按事先设计好的问卷进行,非标准式访问事先一般不制作问卷。

1

邮寄调查:通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回制定收集点。是一种标准化调查方式,调查者和被调查者之间没有世界的语言交流,信息的传递依赖于问卷。

电话调查:调查者利用电话与被调查者进行语言交流以获得信息,时效快、成本低,但问题数量不宜过多。

原始资料搜集最常用的方法是抽样调查法。所谓抽样调查就是从总体中随机抽取一部分样本进行调查,目的是推断总体的数据特征。抽样调查法具有经济性、时效性强、适应面广、准确性高等特点。

个别深度访问:一次只有一名受访者参加,针对特殊问题的调查,是涉及较隐秘的问题,侧重于定性研究。这次去台湾参加海峡两岸体育史会议,在那里发现一个现象,就是台湾体育专业大学生的论文选题大都研究某一个体育明星的某一时期的业绩及对某一项目在台湾地区的影响力,比如研究棒球明星,当然也研究某项运动在某一时期的发展状况。通常采用查阅二手资料(翻阅当时的报纸),以及对明星的个人深度访问。

观察实验包括观察法和实验法2种方式:

观察法:就调查对象的行动和意识,调查员边观察记录以搜集所需的信息,不需要调查人员强行介入,能够在被调查者不察觉的情况下获得资料。

实验法:是指在设定的特殊试验场所、特殊状态下,对调查对象进行实验以获得所需资料。一般体育专业的研究很少采用到此类方法。

三、调查设计

1、调查方案的内容:调查目的、调查对象和时间、拟定调查提纲、调查方法技术路线。

调查目的:调查要达到的具体目标; 调查对象:调查研究的总体或调查范围;

调查时间:应包括资料本身时间和调查工作的起讫时间; 2、拟定调查提纲

调查项目:调查的具体内容; 调查表:表现调查项目的表格或问卷; 3、调查方法和技术路线 (1)调查的组织机构 (2)参加调查的单位和人员

2

(3)调查员的培训 (4)方式和技术路线 5、有关文件准备与预算

第二节 问卷设计

一、问卷的结构

问卷是调查研究中用来收集资料的主要工具,它在形式上是一份精心设计的问题表格,其用途是用来测量人们的行为、态度和社会特征。尽管实际调查中所用的问卷各不相同,但是他们往往都包含以下几个部分:封面信、指导语、问题、答案、编码等部分(风笑天,2002年10月,社会学研究方法)。

1、封面信是给被调查者的短信。封面信的作用是向被调查者介绍和说明调查单位、调查者身份、调查目的、调查内容、调查对象选择方法以及对调查结果的保密措施等,如果是邮寄调查,必要时还应注明回函的最后期限

(1)要说明调查者的身份。在封面信的开头说明,如“我们是武汉市委政策研究室的工作人员,为了……”当然,调查者的身份也可以通过落款来说明,如:“兰州理工大学体育人文社会学研二学生”,还要附上单位地址、联系电话,以便消除被调查者的疑虑,体现调查的正式性。

(2)要说明调查的大致内容,即“调查什么”。但要注意,对调查内容的介绍不能欺骗被调查者,另一方面,也不能含含糊糊。通常的做法是用一两句话概括地指出内容的大致范围。比如“我们正在我市居民中进行物价改革方面的调查”等。

(3)要说明问什么调查。对于调查目的,应尽可能说明其对整个社会,尤其是对于包括被调查者在内的人群的实际意义。比如,“我们这次调查的目的,是要摸清我市目前市场物价的现状和存在的问题,以便为市政府制定物价改革的有关政策提供科学依据,为进一步改善我市居民的生活服务”。

(4)要说明调查对象的选取方法和对调查结果保密的措施。为了消除被调查者的戒心,应在封面信中简明扼要地做点说明。“本调查以不记名方式进行,并且根据国家统计法,我们将对统计资料保密。所有个人资料均以统计方式出现,”另外还应该说明“答案无对错之分,请您不必有任何顾虑!”

为了争取被调查者的支持并对调查者表示尊重,封面信结束部分一般会对被调查者的合作提前致谢。

3

2、指导语是用来指导被调查者填写问卷的解释与说明,作用与仪器使用说明和实验指导说明一样。有些指导语很少,一两句话说明即可,如,“请根据自己的实际情况在合适的答案号码上画圈或者在空白处直接填写。”

有些比较复杂的问卷的指导语则集中在封面信之后,并标有“填答说明”的标题,其作用是对填表的方法、要求、注意事项等做一个总的说明。如:

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 填答说明:

1、请在每一个问题后适合自己情况的答案号码上画圈,或者在__处填写适当的内容。

2、问卷每页右边的数码及横线是计算机处理用地,您不必填写。 3、若无特殊说明,每一个问题只能选择一个答案。 4、填写问题时,请您不要与他人商量。

 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 3、问题及答案

这是问卷的主体,也是问卷设计的主要内容。从形式上看,问题可以分为开放式和封闭式两大类。所谓开放式问题,就是那种只提出问题,但不为回答者提供具体答案,由答题者根据自己的具体情况自由填答的问题。封闭式问题则是在提出问题的同时,还给出若干个答案,要求回答者根据实际情况进行选择。开放式问题的优点是允许回答者充分自由地发表自己的意见,因而所得资料丰富生动。缺点是资料难于编码和统计分析,对回答者的知识水平和文字表达能力有一定要求,花费时间和精力较多,还可能产生一些无用的资料。封闭式的优点是,答题方便,省时省力,资料易于统计分析。其缺点是资料失去了自发性和表现力。

探索性调查(如心理方面)中常用开放式问题构成的问卷,而在大规模的调查中,则主要采用以封闭式问题构成的问卷。

4、编码

在以封闭式问题为主的问卷中,为了将被调查者的回答换换成数字输入计算机进行处理和定量分析,需要对回答问题进行编码,即赋予每一个问题一个答案及答案一个数字作为它的编码。编码一般放在问卷每一页的最右边。如:

(1)您的年龄: 岁 1-2_ (2)您的性别:①男○②女○ 3_

4

(3)您的文化程度 4_ ①小学以下 ②初中 ③高中或中专④大专以上

(4)您每月的收入为多少? 元 5-8_

除了编码意外,有的问卷还需要在封面上印上问卷编号、调查员编号、审核员编号、调查日期、被调查者住地、被调查者合作情况等有关内容。如国家级调查问卷,包括人口普查、国民体质调查等。

二、问卷设计应注意的几个问题 1、要明确问卷设计的出发点

问卷设计要紧紧围绕所研究的问题和所要测量的变量来进行,进来避免与主题无关的题目存在。

2、要考虑被调查者的主观感受

问卷的题目不宜过多,一般问卷的题量应控制在30分钟内完成较好,如果题量太大,答题时间太长,人们往往就会失去耐性。所以,设计问卷时不能只把注意力放在编制什么问题上,还要注意问卷调查过程中人的因素。要多为答题者着想,多从答题者的角度考虑,尽量为他们填答问卷提供方便,减少困难和麻烦。

3、调查内容不同,问题难度设计也应不同

对于那些回答者比较熟悉的内容、容易引起回答者参与兴趣的内容、不会对被调查者产生心理压力的内容,问题设计可以相对详细、深入,提问比较直接,问题数量可以多一些;但当调查的内容回答者不熟悉时或者比较枯燥时,问题设计就应概略一些、简单一些或者间接一些,问题数量也应少一些,措辞也应更加小心一些。

4、针对不同的样本,问题方式应有所不同

应该考虑构成调查样本的被调查者是些什么样的人,他们的职业、文化程度、性别、年龄等,即使是同样的调查内容,用于工人的问卷和用于大学生的问卷在语言设计上应有所不同。用于工人的问卷,其语言应该更通俗、简单和口语化;而用于大学生的问卷,语言就可以书面化一些。

三、问卷设计的步骤 1、准备工作

熟悉和了解调查对象的一些基本情况。如果有条件,设计者围绕所要调查的问题,自然地、随便地与调查对象交谈,留心观察他们的反应。并依据调查对象的回答情况,设计出恰当的问题

5

2、设计初稿

有两种方式可以参考:

第一种是先把所有问题都列出来,分类整理,并按照合适的询问顺序排序,最后按照问卷整体的逻辑顺序,做出问卷。

第二种是根据研究内容,在纸上画出整个问卷的各个部分和前后顺序,根据这个框架具体地写出每一部分的问题,最后根据答题者阅读和填写问卷的角度考虑,对所有的问题进行调整和补充,做出问卷。

如果以上两种方式都有难度,那就多阅读与你的研究内容相似的硕士论文,模仿人家的问卷内容,进行仿写,并通过与同学或者老师的沟通交流不断完善。

3、对问卷的评价

问卷初稿设计好后,不能直接用于正式调查,而必须对问卷进行试用和修改。 客观检验法:将问卷初稿打印若干份,采取非随机抽样的方式选取一个小样本,用问卷初稿对他们进行调查。对调查结果认真分析和检查,从中发现问题和缺陷并进行修改:

(1)回收率。如果回收率较低,比如说60%以下,那说明问卷设计上有较大问题。 (2)有效回收率。收回的废卷越多,说明答题者回答完整的就越少,意味着问卷初稿问题较多。

(3)填写错误。如果是“答非所问”,说明问题设计的不够简洁明了,语句含义不明;如果是答题方式的错误,说明问题形式过于复杂,指导语不明确。

主观评价法:就是我们常用的专家调查法,将设计好的问卷初稿复印若干份,分别送到该研究领域的专家、研究人员,请他们阅读和分析问卷初稿,并根据他们的经验和认识对问卷进行评论,指出不妥之处,根据专家的意见进行修改。有时候这个过程要重复很多次,才能达到最终想要的结果。

4、定稿

根据上述方法找出问卷中所存在的问题后,逐一对问卷中的问题进行认真分析和修改,最后才能定稿。只有经过了使用和修改,并对校样反复检查后,才能把问卷送去印刷,并用于正式调查中。

四、问卷回收率问题(张力为,体育科学研究方法)

评价回收率并无统计学依据,提出50%、60%、70%、80%或者90%的回收率标准不是从统计学出发而是从回收的难易程度出发的。那么回收率到底以多少为可接受的标准

6

呢?经过分析,张力为认为考虑以下原则:

第一,邮寄调查研究中,采用较为严格的标准,将60%作为底线; 第二,在现场调查中,将90%作为底线;

第三,充分理解上述60%和90%两个数字并无统计学基础,仅指问卷回收难易程度的经验标准。

五、关于问卷的效度与信度问题 (一)问卷的效度

效度,指的是测量手段的有效程度,具体说就是问卷所列的问题能否反应调查你所要研究的问题。效度包括内容效度和结构效度。

内容效度是指所问卷所设计的问题反映调查目标的准确程度。 确定内容效度的方法:专家调查法和统计分析法; 结构效度是指实际操作的经验与理论上的构想的符合程度。 确定结构效度的方法:逻辑分析法(专家调查法)和统计分析法;

祁国鹰:用事实性问题可用来判断问卷的有效性,如果一份问卷有5个问题有问题,可视为无效问卷。

风笑天:(社会学研究方法):如果一份问卷可以投入使用,说明问卷已经具备了效度,不管采用客观测验法和主观评价法。

一般都采用专家调查法来进行问卷的效度检验,主要原因是易于操作。

我们当时做完开题以后,导师让我们先做问卷和问卷的效度检验,就是说如果这步工作做好了,后面的论文做起来就相对比较轻松了。

(二)问卷的信度

信度,指的是问卷的可靠性和客观性,反应测量数据的可信程度;

任宏:在相同条件下对同一批受试对象使用相同的测量手段(问卷),重复测量的一致程度(操作定义)。

张力为:测量结果的一贯性、一致性、再现性和稳定性(一般定义)。 简单地说,信度反映的是问卷设计问题的可靠性和客观性; 而效度反应的是测量出来的数据是否真实的问题。 所以说,有效度一定有信度,有信度不一定有效度 效度检验:裂半法、克隆巴赫a系数法

7

第三节 认识SPSS

SPSS是Statistical Product and Service Solutions的缩写,即社会科学统计软件,它与SAS(Statistical Analysis System)都是国际上有影响的统计软件。

SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织,在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。2000年正式将英文全称更改为“统计产品与服务解决方案”,2009年被IBM公司收购,至今已发展到spss21.0版本。

在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。

(一)定义变量

SPSS中的变量与统计学中的变量概念一直,对总体单位而言,它表示统计标志。对总体而言,则表示统计指标。

SPSS变量具有以下属性:变量名、变量类型、变量长度、变量标签、缺失值、单元格宽度、对齐方式、测度水平等。

(1)变量名称(Name):不多于8个字符,不得使用ALL、AND、BY、EQ、GE GT LE NE NOT OR WITH等保留字。

(2)变量类型(Type):数值型(系统默认)、字符型、日期型,在数值型变量中,系统默认的是标准型数值。在输入学号、省份证号等以数据的形式展现变量一定特征的数据时,变量类型最好选择字符型,否则像“09010102”之类的学号就无法输入。

(3)变量宽度(:Width)与小数位数(Decimal):Width可指一个变量的总宽度,Decimal则用于一个数值型变量的小数位数。

(4)变量标签(Variable labels):是对变量名含义的进一步标识说明,有助于人们更好地理解变量的含义。因为变量名一般不能超过8个字符,人们为了方便也愿意用一些简单的字符或缩写作变量名,而这样的变量名有时不足以表示变量的含义,特别是

8

在变量比较多的情况下,尤其需要对变量名的含义加以解释,设置变量标签有助于人们更好地理解变量的含义。并且在输出统计结果时,用变量标签替代变量名会更详细、更明确。注意:用作变量标签的字符数不得超过256个。

(5)数值标签(Value labels):是对变量取值所做的进一步标识说明,对分类变量往往要定义其取值的标签。实际操作中,有利于数据的输入与整理。例如,用“1”代表男,用“2”代表女等等。当然,也可以用“1”代表某个数值段。

(6)定义缺失值(Missing value):在实际的科研工作中往往会因为某种原因使记录的数据失真,或没有测到,或没有记录,即定义为缺失值。在SPSS中,对字符型变量,系统默认的缺失值是空格,对数值型变量,系统默认的缺失值为零。系统默认的是状态是没有缺失值,即当前变量的值、记录完全正确,没有遗漏。

如果要定义离散型缺失值,可以输入3个确切的、可能出现的缺失值。例如,对“性别”变量,我们将1和2分别作为代表“男”“女”的值,若数据中出现了0、3、4,就可以作为缺失值处理。

定义一个缺失范围加一个离散值。这种选择主要针对连续性变量,指定某一个范围内的值如果出现在当前定义的变量值中,则当做缺失值处理。此外还可指定一个该范围包括不了的值。例如,在输入变量“身高”时,错误地输入了1.30、1.90、1.95、2.03几个值,则可以选择该种定义缺失值的方式。可在“低”后的提示框中输入缺失值的下限1.90,在“高”后提示框中输入缺失值的上限2.03,在“离散值”后的提示框中输入1.30.若非法值都包含在某个范围之内,则“离散值”后的提示框中可不输入任何数据。

如果以上方法还不能把所有的非法值包括在内,则要在数据文件中查出错误数据进行修改。

(7)定义变量显示的宽度(Width):变量的显示宽度只影响变量值在数据编辑窗口中的显示效果,对所定义的变量宽度和变量的均值均无影响。

(8)定义变量的对齐方式(Alignment):一般情况下,系统默认数值型变量的的对齐方式是右对齐。

(9)定义测度标准(Measurement):统计学中,所谓测度是指按照某种法则给现象、事物或事件分派一定的数字或符号,通过测度来刻划事物的特征或属性。例如,对人进行测度,其属性或者特征有性别、年龄、身高、体重、职业等。可以用58公斤标识某人的体重,用1.72米标识他的身高,用1(男)或2(女)标识他(她)的性别。一般

9

来说,任何事物都具有直接或者潜在的可测性,但是可测的程度或者水平是不同的,统计学中,通常将测度分为Scale(定比测定或比率测度)、Ordinal(定序测度或顺序测度)、Nominal(定类测度或名义测度)。并认为3种测度水平以Scale测度的测度水平最高,Ordinal测度次之,Nominal测度的测度水平最低。从统计学的角度,测度选择一般按以下原则进行:

①取值于一个区间,或者取值为比率的连续型变量应设置为Scale测度,如职工收入、身高、体重,产品的价格等。

②无论数值型变量还是字符型变量,只要资料具有某种内在的顺序分类,如可明显地区分为大、中、小;高、中、低;优、良、中、差等,则应设置为Ordinal测度。

③资料如果是不具有某种内在顺序分类的字符型变量,如工人的工种、公司里的部门、地理区域划分等,可以设置为Nominal测度。表示明显分类的数值性变量也可以设置为Nominal测度,如将性别(Sex)定义为数值型变量,1=“男”,2=“女”。

(二)数据的录入与编辑

1、直接录入:数据录入的方法多种多样,可以定义一个变量,接下来按变量列输入该变量的各个数值;也可以先将所有的变量全部定义完,然后按观测量来输入,即将一个观测量的各个观测值按行录入。

需要指出的是,无论用哪一种方法输入数据,输入单元格的变量值必须与事前定义的变量类型一致。如果变量为数值型,在单元格中输入字符,系统将拒绝接受;如果变量为字符型,在单元格中输入了数值,系统将这个数字当作字符对待。

2、从EXCEL表中粘贴数据,需事先设置好变量性质。 3、数据文件的编辑 (1)变量的插入与删除 (2)观测量的插入与删除 (3)单元中数据的编辑 (三)数据整理 1、计算生成新的变量

在进行数据分析处理时,常不局限于原始测量输入的变量和数据。在很多情况下,往往需要根据已经存在或输入的变量,产生新的变量,从而有利于我们更好地利用已有的数据,做出科学的分析。

点击“转换”—“计算变量”出现一个对话框,在“目标变量”一栏中输入变量名,

10

接着输入标签名,就可以计算了。

第四节 体育统计的基本概念

一、总体与样本

观察和测量是体育科研的最基本的方法。

观察和测量的结果一般用数据表示,一个数据库分类变量越多,活性越强,可分析的内容就越多,越有科研价值。

我们把要研究的对象的全体就叫总体。总体是根据研究目的确定的同质的研究对象的全体,更确切地说,是性质相同的的所有观察单位某种变量值的集合,构成总体的每一个对象称为个体。

总体中所包含的个体数目是有限的,叫有限总体。如研究某种训练方法对某运动项目的运动员的竞赛成绩的影响,其观察的数值是不确定的、无限的,就叫无限总体;其同质基础是同运动项目的运动员,采用同种训练方法。

若总体中所包含的个体数目是有限的,叫做有限总体。如,研究某地某年正常成人的血压值,这里的总体只包括有限个观察单位,就叫有限总体,其同质基础是同一地区、同一年份的正常成年人。

体育研究中很多是无限总体,即使是有限总体,若包含的个体太多,直接研究总体也是不可能的(耗费人力、财力),所以在实际工作中,常需要按照一定方法总体中抽取有代表性的一部分,所以我们把抽取的部分研究对象叫样本,用n来表示。所以,科学研究一般运用样本信息来推断总体特征。

总体一般用N来表示,样本一般用n来表示。

样本有大小之分,大样本n≥70,小样本≤30.官方一般把总体含量的70%称为大样本,我们一般研究中无法达到这样的水准,具体问题具体分析对待。

一般情况下,样本牵扯到的分类变量越多,样本量应越大。

当我们观察或抽取到一定的样本后,通过对样本数据的整理和分析,使数据传递的信息清晰地显现出来,为政府部门提供一定的建议;具体到我们的实际研究,目的就更明确,如果只是写一份报告,只要分析数据的一般特征,进行描述就行了;如果要标明或得到一定的规律性的东西,就需要对数据进行进一步数理统计分析。

所以,一般的研究过程是观(察)测(量)→数据整理→数据分析→统计检验→得出结论→指导实践 二、常用统计量

11

在对数据进行初步的整理时,常常是将一些无次序的数据整理成比较直观的图、表,进一步的研究是将计算出一些数值,用这些数值来说明数据的全貌,这些数值就是统计量。一般数据都有集中趋势和离中趋势两大类。

(一)反应数据集中趋势的统计量

集中趋势是指数据中大部分变量值向某点集中的趋势。 指标有平均数M(×),众数Mo,中位数Md。 1、平均数就是指算数平均数;

2、众数是指一组观测现次数最多的那一个变量值,一般可用观察法得到。如果数据较多,可编制一个频数值中出分布表来获得。

3、中位数是指各个变量值按照大小顺序排列,处于中间位置的那个数值。简单地说,比它大与比它小的数一样多的数,就是中位数。

求中位数,先排序,然后确定中位数的位置。 当n为奇数时,Md=(n+1)/2;

当n为偶数时,Md是第n/2与(n+1)/2个数的平均值。 (二)反应数据离中趋势的统计量

为什么要研究数据的离中趋势呢?举个例子: 有两支队伍的平均身高均为10 甲队 X=10 7 10 13 乙队 X=10 9.9 10 10.1

这两个队的平均身高相同,如果只是看平均身高,能看出什么问题来吗?看不出来,但是具体看每个队员的身高,很明显甲队更具空中优势。

再比如:某田径队两个队员只能选择一个去参加比赛,一个队员的成绩比较稳定,一个队员的成绩起伏较大,但都具备前三的水平,那么派谁去参加比赛呢?如果你要保证前三的成绩,就派成绩相对稳定的队员去参加;如果想冲击金牌,就得派成绩起伏较大的队员去参加,当然冲击金牌是有风险的,有可能连前三都保不住。当然,任何一次比赛,尤其是田径比赛,谁也没有把握说某次比赛一定能拿冠军,只能说谁的机会更大一些,谁更稳定一些。

如果某个队员的成绩离中趋势特征突出,就可派该队员去冲击金牌,如果某个队员成绩集中趋势特征明显,就派该队员去保证一个相对稳定的成绩。

所以数据的离中趋势更多地考虑了数据的个体差异,表明了数据的波动性。因此,

12

要真实地反应一组观测值的全貌和特征,必须对其离中趋势和集中趋势作全面考察,把离中指标和集中指标结合起来,全面反应一组数据的特性。

离中趋势是指变量值的离散程度,用以描述一组变量彼此相差与散布的情况,反应变量的波动性和不稳定性的趋势。

描述变量离中趋势的指标叫做变异指标:全距R,平均差AD,方差与标准差S2、S,变异系数CV,平均数的标准误SE

1、全距=Max-Mix 大体上反应数据的扩展范围。

2、平均差表示各个离均差的平均数,平均差越大,则表示数据变动度越大,反之则表示数据变动度越小。

其中∑为总计的符号,x为变量,x'为算术平均数,n为变量值的个数。 离均差指某一个变量与平均数之差。将各个离均差的绝对值相加,再除以样本数,即为平均差。

3、方差与标准差

由于计算平均差要取绝对值,计算过程繁琐,实践运用较少,在实践中一般采用将各个离均差加以平方,用这种方式表示变异情况的指标,就是方差,用V或S2表示。标准差就是对方差开平方的结果,用Sd表示。

4、变异系数

以上变异指标都有一个共同的特点:它们一般都具有具体的计量单位,都会受到采用计量单位不同或计量单位变化的影响。

计量单位对变异指标的影响,常常会给不同总体之间的对比分析带来极大的不便。例如,运动竞赛中百米成绩与跳高成绩,其计量单位是秒和米,两者之间的变异程度就不能直接进行比较。所以,统计学中采用变异系数来解决此类问题。

变异系数(CV)是一类相对形式的变异指标,是将上述各种绝对数或平均数与平均值相比较的结果,一般最常用的就是标准差与平均数的比较,因此,当人们不加说明地提到“变异系数”时,通常指的就是标准差系数。

5、平均数的标准误

13

从某一总体中抽取很多个含量相等的样本,每一个样本都可以计算出一个平均数,所得各样本平均数大小各异,如果把这些样本平均值看做变量值,而求出它们的标准差,以表示样本平均数的离散程度。这种用来表示样本平均数离散程度的标准差,成为平均数的标准误,简称SE。标准误表述的是抽样的平均误差,标准误越小,说明样本的代表性越好。所以,要保证得到一个好样本,必须保证足够的样本量。

一般情况下,我们把∣x- x∣叫偏差x,通过偏差可以发现异常数据,当∣x- x∣≥3S时,则x为异常数据。

拿到一个样本第一步是清理数据。例如样本(X)X1……Xn 1、排列数据 2、计算x,S,n

实战中用x±S来描述一个样本,用来预测置信区间: 95%的数据在x±1.96S之间 99%的数据在x±2.58S之间 3、判断清理异常数据:

在一个样本里,特大或特小的数据,不能轻易去掉;不是你研究范围的数据叫异常数据,即∣x- x∣≥3S时,或者计算gn=∣x- x∣/s, gn≥3时,应剔除掉。

当然,有时候在处理一些异常数据时,还要依靠经验来判断。 例子:论文中一般运用的数据汇总表(三线表)

表1 n=

体重 身高

n

x

S 表2

Max

Mix

体重 58±S

身高 肺活量 立跳

握力

156±S

14

第五节 统计分析报告

1、分层报告过程

SPSS的OLAP Cubes(在线分析过程)可以对一个或几个分类变量的每个分组形成分层的表格,报告分析变量在各组中的相关统计信息,这种分层报告的表格具有信息量大、形式简洁、便于查看的特点。

15

2、观测量概述

16

17

18

描述统计过程

在对数据进行初步的整理时,常常将一些无次序的数据整理成比较直观的图、表等。但要对数据进一步地分析研究,仅用图表就难以很好地满足实际工作的需要,还需通过已有的数据,计算出一些数值,用这些数值来说明数据的全貌或概貌,用于说明数据的全貌或概貌的数值就称之为描述统计。

频数分析过程:主要是对变量的描述统计分析。

19

20

时,则不能拒绝H0,不能认为两总体均数存在差异。其理由是:在H0成立的条件下,出现等于或大于t值,其概率当P≤a是小概率事件,一般不可能发生,因而拒绝假设;若P>a,即概率发生的可能性比较大。

5、小结:

(1)统计方面小结:

a统计量:U值、T值、样本量、平均值、最大值、最小值、标准差、标准误等 b显著性水平 (2)专业方面小结

虽然统计很重要,但不能完全交给统计。所以,在实际研究中,除了做出统计学的结论外,还应结合体育专业知识或者具体情况做出符合实际的结论。

三、常见的均值比较过程

1、单个样本T检验:适用于来自一个正态总体的样本的均属与总体均属比较的T检验。样本均数与已知总体均数比较的目的是推断样本所代表的未知总体均数与已知的总体均数是否相等。(体育统计与SPSS)

如:考察所测试运动员的简单反应时的平均数是否为180毫秒。方法是将“简单rt”作为检验变量调入显示窗,检验值输入180,操作后,结果如下:

表1单个样本统计量 简单rt N 37 均值 183.76 标准差 21.153 均值的标准误 3.478

表2单个样本检验 t df 检验值 = 180 Sig.(双侧) 均值差值 差分的 95% 置信区间 下限 简单rt 1.080 36 .287 3.757 -3.30 上限 10.81

表1为变量的基本指标,表2是检验结果。简单反应时的平均数与检验值(180)检验的t值为1.080,检验的显著性水平Sig.(双侧)为0.287>0.05,可以得出差异不显著的结论,可以认为所测试的运动员简单反应时的平均数为180毫秒。

如果输入的检验值为173,则结果肯定不一样。

31

单个样本统计量

简单rt

N

37 均值 183.76 标准差 21.153 均值的标准误

3.478 单个样本检验 t df 检验值 = 173 Sig.(双侧) 均值差值 差分的 95% 置信区间 下限 简单rt 3.093 36 .004 10.757 3.70 上限 17.81 检验的显著性水平Sig.(双侧)为0.004<0.05,可以得出差异显著的结论,简单反应时的平均值肯定不是173.

2、独立样本T检验:适用于对来自两个正态总体的相互独立的样本的均值的T检验。(体育统计与SPSS)

如:考察所测试的乒乓球运动员的简单反应时的男女性别间是否存在差异。 组统计量 简单rt 女性 14 193.43 16.275 独立样本检验 4.350 性别 男性 N 23 均值 177.87 标准差 21.907 均值的标准误 4.568 方差方程的 Levene 检验 F Sig. t df 均值方程的 t 检验 Sig.(双侧) 均值差值 标准误差值 差分的 95% 置信区间 下限 上限 假设方差相等 简单rt 假设方差不相等 1.066 .309 -2.295 35 .028 -15.559 .019 -15.559 6.780 -29.323 -1.795 6.308 -28.386 -2.732 -2.467 33.447 结果分析说明如下:

在两个正态总体的方差相等和不等时,构造的检验统计量不同。由于我们未知两个正态总体的方差信息,必须首先通过F检验,SPSS系统采用列文方差一致性检验来判断。如果F检验得出的相伴概率P≤a,则认为两个总体的方差差异显著,表明方差缺乏齐同性或一致性,不符合T检验的条件,则需要用校正的t’检验来代替t检验。如果P>a ,则认为两个总体方差之间差异性不显著,在判断分析T检验结果时选用方差一致性或方差齐性行给出的相伴概率P1。

本检验F值为1.066,Sig.值为0.309>0.05,故认为方差一致,结果分析采用第一行的T值与Sig.值。Sig.值为0.028<0.05,男女运动员简单反应时平均数差异达到了15.56

32

毫秒,故认为所测试的不同性别乒乓球运动员简单反应时存在显著性差异。

3、配对样本T检验:是通过对样本均值的比较来对两个正态总体均值之间的差异是否显著。与独立样本T检验不同的是,配对样本T检验来自两个总体的样本,不是相互独立的,而是相互关联,搭配成对,数量相等。

33

21

描述统计量过程:

统计量是研究随机变量变化综合特征(参数)的重要工具,它们集中描述了变量变化的特征,所以常称它们为描述统计量。SPSS中主要给出了均值、算术和、标准差、最大值、最小值、极差和平均数标准误等常用的统计量,在SPSS的众多统计过程中都可以输出变量的统计值。如果仅需要了解统计量的信息,那么使用“描述统计”过程计算更加简便快捷。

数据探索过程:探寻数据结构、数据中隐含的内在统计规律,还可以发现或检查数据中的错误。

22

23

多维交叉表过程

交叉表过程可以显示两个或多个变量的联合频数分布表,简称列联表或交叉表。

24

第六节 均值比较过程 一、均值比较

根据从总体中抽出的随机样本,对未知总体的分布特征进行统计推断是统计学的基本任务之一,这种推断常常表现对总体所依赖的参数的推断。在所有数字特征中,均值是反映总体一般水平的最重要的特征,调查的来的样本,能否认为是来自于某个确定均值的总体?就需要比较样本均值与总体均值之间的差异。

报告1

简单rt 性别 男性 女性 总计

均值 177.87 193.43 183.76

N 23 14 37

标准差 21.907 16.275 21.153

报告2 简单rt 性别 单位 省乒乓球队 男性 体院乒乓球专选学生 总计 女性

省乒乓球队 179.85 177.87 191.43 13 23 7 23.996 21.907 14.046 25

省体校乒乓球队 均值 179.50 169.00 N 6 4 标准差 21.380 18.092

省体校乒乓球队 192.75 4 22.232 体院乒乓球专选学生 199.00 3 18.083 总计 193.43 14 16.275 省乒乓球队

185.92 13 18.094 省体校乒乓球队

180.88 8 22.655 总计

体院乒乓球专选学生 183.44 16 23.746 总计

183.76

37

21.153

26

27

28

当选择“性别为第一层变量时,“简单rt”的Eta值等于0.362,“Eta方”值是因变量和自变量之间联系密切程度的统计量,其值越接近于1,则说明二者之间的练习越密切。

二、T检验 (一)检验原理

均值比较一般采用T检验,T检验亦称T分布检验,是在整体正态分布下,当方差未知时以t分布为依据对总体均值作检验的方法。

T检验前应考虑的几个必要条件:

1、资料的获取应按随机原则。就是说资料不是按照研究人员的主观愿望挑选来的。 2、T检验要求资料满足正态分布。一般来说,只要样本达到一定的数量,样本平均数的分布是近似正态的。

29

3、T检验还要求方差齐性。即样本均数与总体相比较时,样本资料计算的方差应近似总体的方差;样本均数间比较时,两样本的方差应为齐性。

(二)统计检验的一般程序: 1、解消假设H0 U1=U2

2、给出显著性水平:0.05 0.01

我们对假设进行判断的依据是小概率事件原理。

所谓小概率事件原理,是指如果一个事件发生的概率很小,那么在一次试验中,可以把它看成是不可能事件,通常把事件发生的概率在0.05以下称为小概率事件。

在实际运用中,需要根据研究的具体问题先规定一个界限a(0<a<1),当某事件的概率P≤a时,就认为该事件是一个实际不可能事件。a称为显著性水平,体育统计中常用的a=0.05和a=0.01水平。

3、选择适合的检验方法: T检验(小样本) 如果统计资料是来自同一总体,直接假设检验;

如果统计资料是来自非同总体,先要检验两样本的方差是否齐性,即两样本的方差有无差异性,若无差异性,再假设检验;

在SPSS软件中,计算出来的结果要进行选择性判断。 如果样本来自同一总体,统计结果只有一行;

如果样本来自不同的总体,就会出现两种结果,先看方差是否齐性,再判断有效性。 计算检验统计量,求U值和T值

目的 H0 拒绝H0 单侧检验 U1>U2? U1<U2? U1=U2 U1>U2 U1<U2 双侧检验 U1=U2? U1=U2 U1>U2 或 U1<U2 4、判断,做结论

(1)检相应统计表,得临界值 (2)比对:

当P≤a时,根据选取的检验水准可拒绝H0,认为两总体均数存在差异;当P>a

30

本文来源:https://www.bwwdw.com/article/t6t2.html

Top