1教育统计与评价 - 复习提纲

更新时间:2023-03-14 15:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《教育统计与评价》复习提纲

《教育统计与评价》测试一填空1.描述性评价的主要特点是:计算综合指标 。 2.标准分数的作用是把各类原始分数统一在高于或低于平均数多少的标准上衡量的。 3.显著性水平指的是显著时犯错误的可能性。

二、选择题1.对两个独立总体的比较即是何种比较?.横向 2.一般来说,复习次数与遗忘程度是何种相关情形?负相关

3.欲比较学生德、智、体、美四个方面是否均衡发展时,应使用何种综合指标?.标准差

4.欲研究辅导是否有效的问题,分别对学生辅导前后进行同一难度不同题目的测验,这时对测验分数的检验方法是哪种?t检验 5.欲研究考试结果能否反映学生的真实水平时,应作何种分析?信度 6.若统计检验结果在0.05的水平上显著,则在0.01水平上是否也是显著?.不一定

三、应用题1.某高三教师自编一套英语测试题,用来预测学生的高考英语成绩,问:据下列测验结果能否说明自编测验对高考有预测效果?分析效标关联效度,应计算积差相关系数并且检验。

2.据某题数据资料计算难度并给予评价。按主观题难度系数公式计算,再判断属难易或适中

四、简述题1 全面说明等级平均数的作用。根据等级平均数适用的数据及评价对象进行思考2应用哪些统计方法可以全面评价教学实验后学生的学业成绩?独立总体和相关总体平均数差异分析结合。

《教育统计与评价》测验二一、填空题1定量评价的主要特点是从量的方面说明教育问题 。 2标准差是反映现象内部差异的一个综合指标。3显著性水平愈小,叫推断结果犯错误的可能性愈小。 二、选择题1.设计调查问卷时,应尽可能采用何种问卷形式?限制式 2.欲全面评价个人或集体时,宣使用何种平均数?评分平均数 3.欲评价某事物的水平时,应使用何种综合指标?平均数

4欲研究某校干部和教师对该校某一改革方案的看法是否一致的问题,属何种检验情形 A两个独立总体比例5欲研究性格与性别的关系问题,应使用何种检验方法?检验6欲研究某班统计学考试成绩是否存在显著的性别差异,应使用何种表?t分布表

三、应用题 1.试比例下列两学生某科两次考试总绩哪个优?其中学生第二次考试是否退步?甲、乙生两次成绩分别转为标准分数再相加或比较2.试对下列某校办二厂两个班组职工的月收入情况予以比较,并说明理由。(单位:元)甲组:672,672,666,660,654,648,648乙组:690,684,672,660,648,636,630综合应用平均数和标准差比较

四、简答题1如何理解一个人的测量结果只是他的真实水平的估计值?据随机误差进行思考2应用哪些统计方法可以全面评价教学实验后学生的学习兴趣情况?独立主体和相关总体比例差异分析结合

教育统计学:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。

教育评价:教育评价是按照一定 的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。

描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。

推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。

横向评价:是将评价对象与其他对象进行比较。它的特点是在评价时不考虑评价对象的背景情况和今后的发展趋势,只是考察评价对象在特定的时间和特定的空间中的现实状态,所以又称静态评价。

纵向评价:是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。 绝对评价:是将病人对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。

相对评价:是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。相对评价也称常模参照性评价。

定性评价:是对教育客观事物的性质进行分析,即从质的方面说明教育问题。

定量评价:是对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。 安置性评价:是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。即为作出某种安排,一般在教育教学活动前进行。

诊断性评价:是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。即为发现问题,一般在教育教学活动前或中进行。

形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即为揭示存在的问题,及时反馈信息,及时进行调控管理。即为提供过程中的信息,一般在教育教学在活动中进行。

终结性评价:是在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明。即为作出某种鉴定,一般教育教学在活动终进行。

限制式问卷:是对提出的问题,根据测评的需要以及实际情况,事先安排好答案,由对方从中选择适当的答案。即找出问题后安排答案,让对方从中选择。限制式问卷又分为单选、多选和排序三种。 1

开放式问卷:是对提出的问题不事先安排答案,而留出空位,让对方自由回答。即找出问题后不安排答案,让对方自由回答。 半限制式问卷:找出问题后既安排答案,也有自由回答。 类别量表:表示事物的分类。(统计人数) 顺序量表:表示事物的顺序。(排名次)

等距量表:既可表示事物的分类、顺序,也有相等的计量单位和相对零点。 比率量表:既可表示事物分类、顺序,也有相等的计量单位和绝对零点。

一般来说,类别量表测量得到的数据库的类别数据;顺序量表测量得到的数据称为顺序数据,等距量表和比率量表测量得到的数据均称为测量数据。

描述性评价:是对数据资料计算综合指标值,然后根据综合指标值对教育客观事物给予评价。

综合指标:指的是从教学方面综合说为事物特征的指标。常用的综合指标有绝对数、相对数、平等数和标准差。 集中趋抛:指大多数数据比较趋近的水平。通常把集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。

离中趋势:指数据之间变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。 标准分数的作用:把各种不同类型的分数统一在高于或低于集体平均分多少的标准上衡量。 标准分数的具体应用

1. 正确评价同一学生科目的成绩,如前面例子。

2. 正确评价同一学生同一科目不同阶段的成绩。如前面例子。 3. 正确评价不同学生多科总成绩。例如p129表8-10。

高考标准化考试报告的分数是已经对z进行了线性变换,即y=500+100Z,这并不会改变原来z的排序,线性变换避免了负数的出现,且有利于选拔。

推断性评价:对数据资料进行统计检验,然后依据统计检验的结果并以一定的置信度对教育客观事物给予评价。 统计检验:数据资料进行统计检验

独立总体:两个总体的对象不同,对它们的差异评价,也可称为横向评价。 相关总体:两个总体的对象相同,对它们的差异评价,也可称为纵向评价。

t检验:独立总体和相关总体的检验都应用了t分布表,这种应用t分布表进行统计检验的方法,通常称为t检验。 显著性水平:

效度是考试的有效性。

内容效度:考试内容与预定要考内容一致性程度。

内容效度的分析方法:利用双向细目标进行分析。注意编制双向细目表的步骤和要求。 效标关联效度:考试结果与效标的一致性程度。 效标关联程度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。 信度:考试的可靠性。

再测信度:用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。

再测信度的分析方法:主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且进行显著性检验。再测信度的不足之处:前后两次考试的时间间隔不易把握。

分半信度:有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。

需理解的问题

1、四种收集资料方法及各自所适用的情况观察法

(1)、观察法的主要特点是到现场观察,特别适用于行为表现方面的评价。

(2)、问卷法的主要特点是填答问题表格,主要适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。 (3)、访问法的主要特点是直接交谈,特别适用于深入了解情况以及不具备填答问卷能力的对象。 (4)、测量法的主要特点是具体测试。 2、选用问卷种类的原则

(1)、能比较简明扼要表达答案意思的可用限制式问卷。

(2)、所比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用来限制式问卷。 (3)、对于复杂的一些探讨性的问题。可采用开放式问卷 3、对测量结果的正确理解(重要)

鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p55第五段。我们不能把测试结果看作一个确定的点,而是具有一定分布范围的或带状的。一个人测试的结果只是他的真实结果的估计值。一个人测试的结果只是他的真实结果的估计值。认识到这一点,我们即可避免对两次测试结果之间小的差别作过分的解释,或不会将两位被测者之间分数不甚大的差别当作有意义的事情看待。 4、各种综合指标的作用 绝对数说明事物的规模。

相对数说明事物的程度或幅度。 平均数说明事物的水平。

标准差说明事物或现象内部差异情况的一个指标。 5、对标准差的解释

标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。

6、等级平均数:

是对总体中各个体根据一定的标准、条件赋予不同等级并按等级归类汇总以后再计算加权平均数的方法。 公式:

X为代表各等级编号,f为代表各等级次数,N代表总次数。 等级平均既可用于总体的评价,也可用于对个体的评价。 标准分数: 标准分数的解释

1.Z>0时,该成绩高于集体平均水平。 2.Z<0时,该成绩低于集体平均水平。 3.Z=0时,该成绩就处于集体平均水平。 4.Z值愈大,该成绩愈好。

2

相关系数是反映两事物之间的联系方向和程度的一个量数。通常用 表示,它的取值范围限于 。 分半信度的分析方法:先计算两部分结果的相关系数,再代入分半信度 计算公式,即 客观题的 应达到0.9以上,主观题的 应达到0.8以上。 难度:试题的难易程度。 难度系数的计算

主观题:公式p=x/w 。x为某题平均得分,W为该题满分值。难度系数的解析:1)P>0.7时较易 2)P<0.3时较难3) 时较适中

客观题:公式p=k/N。K为某题答对人数,N考生总人数。一般来说,全卷的平均难度应在0.45-0.55之间。全卷的题目难度分配一般为 易:中:难=3:5:2。当然结合考试目的灵活处理。 区分度:试题的鉴别能力。 区分度分析:

1.相关法:计算学生试题得分与试卷总分的相关系数并且进行显著性检验。 2.两端分组法 ① 两端分组法区分度(D)的计算公式; D=

其中 分别为学生高分组和低分组中的难度。注意高分组和低分组各取27%的学生。 ②两端分组法区分度D的解释 1)当D 时区分度属好 2)当 时区分度比较好 3) 时区分度还可以 4)

计算公式及应用

一、独立总体差异检验规则 若

则认为两个比例差异不显著,否则认为差异显著。 可查正态分布(附表一)得到。

例1:某方案的态度:80教师70赞成,100学生74赞成 则P1=70/80=0.875 P2=74/100=0.74 n1=80 n2=100 计得Z=2.360

查得Z1-0.05/2=0.975=1.96

因l2.360﹥1.96故该方案的态度存在显著差异

例2:某市甲校参加课外活动的学生占64%,忆校占58%。

解:本题属于“独立总体比例的差异分析”情形。但本题缺少条件:假定甲120人,忆110人。 1、 算也z值,将数据代入公式 算得Z=0.94

2、 检验:因为Z=0.94﹤ Z1-0.05/2=0.975=1.96

所以可以认为两校参加课外活动的人数比例没有差异。 二、相关总体差异检验规则 若

则认为两个比例差异不显著,否则认为差异显著。 公式中的b、c是看法不一致的两类人数。

例如100人对两个方案的表态有下面四种情况: ①a=55 ②b=5 ③c=15 ④d=25 其中第②、③两类人数即为b和c

以上关于比例的差异分析,无论是独立总体还是相关总体的检验都应用了正态分布表,这种应用正态分布表进行统计检验的方法,通常称为u检验。

例1解:1、算出Z值,将数据代入公式, 计得Z=2.24 2、检查:因为Z=22.4﹥ Z1-0.05/2=Z0.975=1.96

说明教师对两个方案的态度存在显著差异,方案2比方案1容易接受

例2 100青年作两个实验。结果:两个都通过有45人,实1通过而实2未通过有23人,实1未通过而实2通过有5人,两个实验都不通过有27人。

解:本题属“相关总体比例的差异分析”情形 1、算出Z值,将数据代入公式, 计得Z=3.4 2、检查:因为Z=3.4﹥ Z1-0.01/2=Z0.9995=3.29

说明两个实验的成绩结果相差非常显著,方案1比方案2简单得多。 三、 检验(两事物均为类别数据)

x21(0.05)=3.841 x21(0.02)=5.412 x21(0.01)=6.635 x21(0.001)=10.827 2×2的 检验规则(均为二分型的类别数据) 若

则认为两事物关系不显著,否则关系显著 例1 参加公益态度:积极:男20 女30 消极:男25 女16

解:本题属“ 检验”情形 1、 算出x2值

将各数据代入公式x2= =3.17 2、 检验:df=(r –1)(k-1)=(2-1)(2-1)=1 查表x21(0.05)=3.841

因为x2=3.17﹤x21(0.05)=3.841,所以学生参加公益活动与性别不存在显著关系 (青年的地区来源对电影的评价态度没有差异) 作业1:数学成绩是否存在显著差异?

男:96 -72-83-67-78-92-89-54-87-74-74-68-71-63

女:95-76-88-81-68-77-47-72-83-62-67-59-74-85-87-76

3

解:本题属于:独立总体平均数的差异分析”情形. 1、 算标准差

代入数据,算得S1=11.91 同理,算得S2=12.25 2、 算t值 算得t=0.333

3、 检验:df=n1+n2-2=14+16-2=28 查表得t(28)0.05=2.048

因为|t|=0.333﹤t(28)0.05=0.05

所以该班男女生的数学成绩不存在显著差异。

作业2:教师宣称,他的学生在期中和期未考试成绩相似,为检验他所宣称的是否属实,随机抽取九名学生考察,结果如下,这些资料是否证实教师所宣称的结果是事实? 学生号1 2 3 4 5 6 7 8 9

期中66-67-80-83-92-54-89-67-85 期未81-82-73-84-87-68-97-76-91

解:本题属于“相关总体平均数的差异分析”情形

1、 求数据差的平均数Xx1-x2(期未为1、期中为2) 代入数据算得Xx1-x2=5

2、 求配对数据差的标准差S x1-x2 代入数据算得S x1-x2=7.4833 3、 算得t值

4、 检验:df=9-1=8 查表得t(8)0.05=2.306 因为|t|=2.004﹤t(8)0.05=0.05

所以期中、期未考试成绩不存在差异。该教师所宣称的结果属实

作业3:下列学生的历史、地理成绩,能说明学生的历史、地理成绩有显著的关系吗? 学生号1 2 3 4 5 6 7 8 9------15 历史81-86-73-81----------77-78 地理80-84-80-72----------77-72 解:本题属于“积差相关”情形

1、 算出标准差。可算出S x=5.26, S y=5.99 S x-y=7.3 2、 计算相关系数r

将以上的数据代入公式r= 3、 检验 df= 15-2=13

查p381的附表得r(13)0.05=0.5139, r(13)0.01=0.641 因为r =0.163﹤r(13)0.01=0.641

所以认为历史与地理成绩差异不显著。

作业4:20名同龄青年的身高,能说明身高与性别有显著的关系吗? 性别 女 男 女 男 女 男 女 男 女 男 女 男

身高153 155 146 156--------------------------------156 169 解:本题属于“点双列相关”情形:

1、 分别算得X指标 Xp=158.839(男生) Xq=151.25(女生) P=0.6 q=0.4 Sx=6.72 2、 算出相关系数rpq= 3、 检验df =20-2=18

查表r(18)0.05=0.444, r(18)0.01=0.5614 因为rpq=0.553﹥r(18)0.05=0.444 所以身高与性别有显著差异。

第一讲 教育统计与评价概述

一、 要记忆的问题

1.教育统计学:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。

2.教育评价:是按照一定的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。(教材第3页最后一段)

3.描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。

4.推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。

5.横向评价:是将评价对象与其他对象进行比较。横向评价又称静态评价。P8

4

6.纵向评价:是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。P9

7.绝对评价:是将评价对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。P9

8.相对评价:是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。相对评价也称常模参照性评价。P10

9.定性评价:是对教育客观事物的性质进行分析,即从质的方面说明教育问题。P10

10.定量评价:是对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。P10

11.安置性评价:是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。P11 (为作出某种安排,一般在教育教学活动前进行。)

12.诊断性评价:是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。P11 (为发现问题,一般在教育教学活动前或活动中进行。)

13.形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即及时揭示存在的问题,及时反馈信息,及时进行调控管理。P12 (为提供过程中的信息,一般在教育教学活动中进行。)

14.终结性评价:是在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明。P12 (为作出某种鉴定,一般在教育教学活动结束时进行。)

二、需理解的问题

1.教育统计学的作用:(模仿课件中举例)

1). 教育统计学是教育科学研究中定量分析的重要工具

唯物辩证法告诉我们,任何客观事物都有其质与量的两个方面,教育现象作为客观存在的一种事物也不例外,因此,教育教学研究中必须对事物进行全面的分析,不仅要有质的研究分析,也要有量的研究分析。

2). 教育统计学是教育评价技术中的重要方法

在众多的教育评价技术中,定量评价是很重要的一个方面,而教育统计方法又是定量评价中分析资料的重要方法。教育统计的结果可以为教育评价提供数量的依据。

3). 教育统计学有助于增强教育决策的科学性。教育统计学中收集资料、分析资料的科学方法以及科学的推断,都可以为教育决策提供依据,提供资料,从而增强教育决策的科学性,提高管理的科学水平。 4). 教育统计学有助于培养科学的思维方式

在新的时期,思维应具有科学性。在教育统计学内容中,无论是描述统计或是推断统计,都可以培养人们的科学思维,学会科学的推论与思考问题的方法,形成实事求是地对待一切事物的辩证唯物主义态度。

2.教育评价的作用:(见教材第6页至第7页)(模仿课件中举例) 1).导向作用; 2).管理作用; 3).激励作用;; 4).诊断作用;; 5).鉴定作用 这些作用在教育过程中的具体体现如图示:

5

式中 代表总平均数, 代表各平均数, 代表各平均数所对应的次数,K 代表平均数的个数。 例如,根据公式(4.5)我们可以算得表4-4 全年级数学成绩平均分为:

表4-4 某年级各班学生人数与数学平均成绩

班 次 人数( ) 平均成绩 ( ) 一 40 75.5 二 38 80 三 43 78 四 41 81.5 ③等级平均数(对个体赋不同等级并按等级归类汇总)

计算方法见P63的(4.3)公式及对表4-2的计算,同样也可以用计算器操作。注意编号可以倒数编,如表4-2的优、良、中、及、不及 按5、4、3、2、1的顺序编号,计算的等级平均数是3.95,但最终的价值判断是一样的,即都是处于良好的水平。

P63的(4.3)计算公式:

式中X 代表各等级编号,f 代表各等级次数,N 代表总次数。例如,对表4-2我们可根据公式(4.3)算得等级平均数为:

由此可知,该班学生的品德是处于良好的水平。

表4-2 某班学生品德考核情况

等 级 优 秀 良 好 中 等 及 格 不 及 格 总 计 编 号 1 2 3 4 5 次 数 13 16 6 3 1 39 等级平均数适用于类别数据的计算,如品德、兴趣、情感等非学业成绩方面的分析评价,常常需要用到等级平均数,它既可以用于对集体的评价,也可以用于个体的评价。 ④评分平均数(对各个方面赋不同比重并评分)

例如p65表4-3的资料,计算方法见p65的(4.4)公式及对表4-3的计算,同样也可以用计算器操作。 P65的(4.4)计算公式:

式中X 代表各方面的分数,P 代表各方面的比重。

例如,表4-3 是对甲、乙两名学生按德、智、体、美 四个方面以五分制分别评分,两人的总分是相同的,均为15分。但如果根据所给的比重以及公式(4.3),我们则可算得:

甲平均分数

11

乙平均分数

由此可知,综合评判这两名学生,甲生稍强于乙生。

表4-3 甲、乙两学生的考察评分情况

评分 ( X ) 项 目 甲 德 智 体 美 总 计 5 4 3 3 15 乙 4 4 4 3 15 30 40 20 10 100 重 ( P ) 根据评分平均数的特点可知,它是一种全面性的分析评价,因此,常常用于评比、选拔等。而且可按如下程序进行:①设计指标;②确定指标权重;③制定评选标准;④评分;⑤计算评分平均数;⑥确定人选。 3)平均发展速度

指事物在某一时期内的平均发展情况.

计算方法见p66的(4.6)公式,由于根据公式往往需要开高次方,不容易做到,所以把(4.6)公式转换为对数的形式计算,

即(4.7)公式,但仍然比较麻烦.因此,可以利用计算器非统计功能中的开高次方,使用统计状态。

P66(4.6)计算公式 <即 用几何平均数计算平均发展速度> :

直接取得结果,但必须取消

式中

代表平均发展速度, 为初期的数值, 为末期的数值,N为初期至末期的时间间隔数。

有时N往往大于2,需要开高次方,所以计算时可用对数法计算,即公式(4.6)可改为下面的公式:

然后求反对数即得平均发展速度 。

例如,根据我国普通高等学校在校学生1980年为114万人,1985年为170万人,我们可应用公式(4.6)算得:

再求0.0346 的反对数可得“六五”时期高等学校在校学生的平均发展速度学校在校生的平均每年发展水平是108.3%,每年平均增长速度为0.083或8.3% .

或108.3%,即“六五”时期高等

平均发展速度是一个相对数,例如p67算得表示平均每年在校生都是上一年的1.083倍。平均发展速度的

作用有两点:①分析评价事物在一定时期内的平均发展速度。②可以用于预测未来的情况,预测公式为:算器中的乘高次方

取得结果。

12

,可用计

(四)标准差(差异)通常用符号 1. 标准差的计算方法

① 未经分类汇总的资料:见P68(4.7)公式以及对甲、乙两组成绩的计算。可用计算器中的统计功能,按照算术平均数的方

(总体标准差)或S(样本标准差)表示。

法输入数据,即可同时得P68(4.7)计算公式: S =

的结果。

式中 为每个数据, 为平均数,N 为数据个数。 例如 甲、乙两个小组某科成绩如下:

甲组:55,58,63,75,80,88,93,95,100,100 乙组:68,70,72,75,80,83,85,89,90,95 可算得: =80.7, =80.7 (平均数),因此可算得: S甲 = S乙 =

以上甲、乙两个小组的平均成绩虽然是相同的,但据S甲 > S乙 可知, 乙组学生成绩的差异比甲组小,也即是说,乙组学生的成绩比甲组的整齐.

②已经分类汇总的资料:见p68的(4.8)公式以及83名教师年龄的标准差计算。同样可用计算器中的统计功能,按照加权平均数的方法输入数据,即可得标准差。

P68的(4.8)计算公式:

式中X为分类汇总后各类的数值,f 为各类的次数。例如就前面的表4-1(某校83名教师的年龄次数分布表)可算得该校83名教师年龄的标准差为:

S =

注意,此例各类的数值即是各组的组中值。 二、需理解的问题:

1. 各种综合指标的作用:(要通过例子理解) 1) 绝对数:说明规模。 2) 相对数:说明程度。 3) 平均数:说明水平。

4) 标准差:说明差异。

2.对标准差的解释:(要会操作,如一道计算题,要求算标准差,并解释)

标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。

13

的结果。对于前面所举的加权平均数的例子,计算器操作时均可同时算得平均数和

3. 总体标准差与样本标准差的区别: 1)分母不一样。

(总体标准差)的分母是n, 而S(样本标准差)的分母是n-1 ;

2) 总体标准差是根据总体的数据计算的,而样本标准差是根据样本的数据计算的。

第六讲 描述性统计分析评价方法——平均数与标准差的综合应用

一、需记忆的问题

1.集中趋势:指大多数数据比较趋近的水平。通常把描述集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。

2.离中趋势:指数据之间的变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。

3.标准分数的计算方法:

正确评价学生的学习成绩 <标准分数=(考试成绩-集体平均分)/集体标准差>

1).Z>0时,该成绩高于集体平均水平。 2).Z<0时,该成绩低于集体平均水平。 3).Z=0时,该成绩就处于集体平均水平。 4).Z值愈大,该成绩愈好。

二、需理解的问题

1.如何全面评价比较总体?为什么?

1) 作为全面评价比较总体的方法,必须抓住数据的两个主要特征进行综合分析,既要分析集中趋势,也要分析离中趋势。也即是说,必须综合应用平均数和标准差对总体予以评价比较。

例如P68甲、乙两班成绩的比较;(既要算平均数和标准差,还要比较) 例如 甲、乙两个小组某科成绩如下:

甲组:55,58,63,75,80,88,93,95,100,100 乙组:68,70,72,75,80,83,85,89,90,95

可算得: 甲 平均数 =80.7, 乙 平均数 =80.7 (平均数),因此可算得: S甲 (甲组标准差) = 16.36 S乙 (乙组标准差)= 8.76

14

以上甲、乙两个小组的平均成绩虽然是相同的,但据S甲 > S乙 可知, 乙组学生成绩的差异比甲组小,也即是说,乙组学生的成绩比较整齐,甲组的成绩比较参差不齐。

又如思考与练习的第6题。P385

(除了算平均数外,还要算标准差。标准差小的,说明大家对他的任职情况的看法比较一致。标准差大的,说明干部职工对他的任职情况不那么一致。)

2) 因为数据既有集中趋势的特征,也有离中趋势的特征,要把两种特征都反映出来,就既要有平均数,也要有标准差。而传统的评价比较总体方法只以平均数对总体进行评价比较,只顾及了平均数,而忽略了标准差, 这是片面的。 2.标准分数的解释(要学会操作。如算出某个学生的成绩并解释。) 1).Z>0时,该成绩高于集体平均水平。 2).Z<0时,该成绩低于集体平均水平。 3).Z=0时,该成绩就处于集体平均水平。 4).Z值愈大,该成绩愈好。 3. 标准分数的作用及应用

标准分数的作用:把各种不同类型的分数统一在高于或低于集体平均分多少的标准上衡量。 标准分数的具体应用:

1). 正确评价同一学生不同科目的成绩,如前面例子。

2). 正确评价同一学生同一科目不同阶段的成绩。如前面例子。 3). 正确评价不同学生多科总成绩。例如p136表8-10。

表8-10 甲、乙两生成绩表

全班 科 目 平均分 语文 数学 地理 历史 政治 总计 70 85 55 42 70 标准差 14.0 3.5 4.0 5.0 8.0 甲 80 90 57 45 70 342 乙 85 88 51 40 90 354 甲 0.71 1.43 0.50 0.60 0.00 3.24 乙 1.07 0.86 - 1.00 - 0.40 2.50 3.03 考试分数 标准分数 高考标准化考试报告的分数是已经对Z进行了线性变换,即y=500+100Z,这并不会改变原来z的排序,线性变换避免了负数的出现,且有利于选拔。

第七讲 推断性统计分析评价方法——平均数差异分析

一、需记忆的问题

15

1.推断性评价:对数据资料进行统计检验,然后依据统计检验的结果并以一定的置信度对教育客观事物给予评价。(置信度,即把握性)

2.统计检验:就是检验事物之间的差异或者联系是否显著问题。

3.独立总体:两个总体的对象不同,对它们的差异评价,也可称为横向评价。例如某班男、女学生某科成绩的比较。实验班与控制班的实验比较,老师与学生对某个问题的态度比较等均为独立总体。

4.相关总体:两个总体的对象相同,对它们的差异评价,也可称为纵向评价。例如,某班学生某,某科中段成绩与期末成绩的比较、实验班实验前与实验后的情况比较、老师们对两个方案的态度比较等均为相关总体。

5.显著性水平:

称为显著性水平,指的是显著时犯错误的可能性,一般取

。5% 也即犯错可能是小概率,

认为是高度不可能发生的,愈小,认为犯错误的可能性愈小,即认为显著的程度愈高。

6.T检验:关于平均数的差异分析,无论是独立总体还是相关总体的检验都应用了t分布表,这种应用t分布表进行统计检验的方法,通常称为t检验。

二、需理解的问题

1.平均数差异分析所适用的数据:更多的是适用测量数据,即有计量单位的数据。(如:身高、体重、考试成绩、年龄、人民币)

2. 独立总体平均数差异检验规则:

则认为两个平均数差异不显著,否则认为差异显著。

(注:S为样本标准差,可查计算器获得。如果计算值<=查表值,则两个平均数差异不显著;如果计算值>查表值,则差异显著。) *注意:①一般取的程度愈高。

②查表时,如何确定

取值?可按照

的顺序进行。先从

开始查,若不显著则

取值。除非

可查t分布表(附表二)(即P379)得到,其中

称为显著性水平,指的是显著时犯错误的可能性,

愈小,认为犯错误的可能性愈小,即认为显著

。5%也即犯错可能是小概率,认为是高度不可能发生的,

停止查表,若结果显著,则可以继续按顺序往下查表;尽可能取显著的取值,而且取显著水平最小的

就是不显著的,则只能取这一结果。(可参考P71的例子。)

3. 相关总体平均数差异检验规则:

16

则认为差异不显著,否则认为差异显著。

例如p72表4-5的资料并得的,而

,而且选取的查表值,这说明时都是显著

则不显著,所以根据前面说的原则选取查表值,即是说,实验前后成绩显著这一结论犯错误

的可能性有1%,一般认为是高度不可能发生的。

4.统计检验查表时显著性水平的选取: 查表时,如何确定显著性水平(

)的取值?可按照

的顺序进行。先从

取值,而且取显著水平最小的

开始取

查,若不显著则停止查表,若结果显著,则可以继续按顺序往下查表;尽可能取显著的值。除非

就是不显著的,则只能取这一结果。

第八讲 推断性统计分析评价方法——比例差异分析

一、需记忆的问题

1.独立总体比例差异检验的计算方法 (P73 4.12 计算公式,不需要统计功能。)

则认为两个比例差异不显著,否则认为差异显著。

(式中P1 和 P2,n1和n2分别为两个的比例及人数。若算得Z值的绝对值大于正态分布表(附表一)中的为两个总体比例存在显著差异,否则认为两个总体比例不存在显著差异。)

值,则认

(怎样查表?如:Z 1-0.05/2 = Z 0.975,先从(P373) 正态分布表(附表一)里面找到0.97500 的值,这样,其左边Z下面列的值是1.9,Z右边行对着的值是0.06,这样就得出Z = 1.96 。)

2.相关总体比例差异检验的计算方法

则认为两个比例差异不显著,否则认为差异显著。 公式中的b、c是看法不一致的两类人数。

3. 正态分布表在分别在显著性水平α=0.05;0.02;0.01的Z值

可查正态分布(附表一)(P373 - 378)得到。

17

4.u检验: 关于比例的差异分析,无论是独立总体还是相关总体的检验都应用了正态分布表,这种应用正态分布表进行统计检验的方法,通常称为u检验。

二、需理解的问题

1.比例差异分析所适用的数据: 适用类别数据,即各类的总人数或百分比。(不仅要记住,还要会操作,会判断。) 2. 独立总体比例差异检验规则

则认为两个比例差异不显著,否则认为差异显著。

可查正态分布(附表一)得到。

3. 相关总体比例差异检验规则

则认为两个比例差异不显著,否则认为差异显著。 公式中的b、c是看法不一致的两类人数。

例如100人对两个方案的表态有下面四种情况:(某校100名教师)

其中第②、③两类人数即为b和c 。

18

将b=5,c=15 代入以上公式(P73 4.13公式)可算得z = - 2.24, 又查正态分布表

,由

= 2.24 > 1.96 说明,教师对两个方案的态度存在显著的差异。从以上例子赞成方案Ⅱ的人数多于赞成方案Ⅰ的人数,所以可以认为在该校教师中,方案Ⅱ比方案Ⅰ更受欢迎些,据此学校可作出相应的决策。

第九讲 推断性统计分析评价方法——相关分析

一、需记忆的问题:

1.相关系数:是反映两事物之间的联系方向和程度的一个量数。通常用2.2×2的

检验计算公式

表示,它的取值范围限于

则认为两事物关系不显著,否则关系显著。

式中,n 表示总人数,a、b、c、d 是两现象都对个体分成两部分后所得四类的人数,如表4-9。

3.积差相关系数的计算方法:< 见

P75

的(4.14)公式。>

式中 和 分别是两现象数值的标准差, 是每对数值之差的标准差,若算得r 值的绝对值大于相关系数 = 0的临界值表(附表三)中的切。若在

值,则认为两现象之间存在显著的关系;否则,认为它们之间不存在显著的关系,即关系不密

0.05 。若在0.05 > 0.01时是显著的,则认为属一般显著情形;

中的df = n-2, 是小概率,一般取

0.01时是显著的,则认为属极显著情形。

4. 分布表在df=1时,α=0.05;0.02;0.01;0.001的df=1时,α=0.05的

值是3.841;α=0.02的

值(见P383,记数值。)

值是6.635;α=0.001的

值是5.412;α=0.01的

是10.827 。

二、需理解的问题

1.相关系数的范围及其解释: 通常用

表示,它的取值范围限于

的正、负号可以反映相关的方向,当

>0时表示正相关;当

<0时表示负相关。

1). 2). 3). 4).

的大小可以反映相关的程度,但需要进行显著性检验。=+0.8与

=0表示毫无关系。

=-0.8表示相关程度是相等的,而相关方向是不同的。

值仅说明两事物是否存在联系,但并不能说明它们是否存在因果关系,两者不可混为一谈。

2.各种相关分析法所适用的条件:(不仅要记住,还要会操作,会判断。如:给一个计算题,要判断数据属于什么数据,再考虑用什么方法。)

1)积差相关法(两事物均为测量数据)

19

2)等级相关法(两事物均为顺序数据)

3)点双列相关法(一事物为测量数据,另一事物为二分型的类别数据) 4)

检验(两事物均为类别数据)

3.各种相关分析法检验规则 1)积差相关系数的显著性检验规则

则认为两事物关系不显著,否则认为关系显著

可查附表三 (P381)得到。

例如表4-7 (P75)是随机抽取10名学生的语文与政治成绩,我们可算得S = 4.572, = 4.695,S = 4.748,据公式(4.14)得 r =

又查相关系数 = 0 的临界值表得 r = r = 0.6819,因为 0.476 < 0.6819,所以可以认为,学生的语文成绩与政治成绩之间不存在显著的关系,即它们两者之间关系不密切。

表4-7 十名学生的语文与政治成绩

学生编号 语文成绩 x 政治成绩 y x - y 2)等级相关系数的显著性检验规则 P76 (4.15)计算公式:

式中D是每对顺序的差, 是顺序差的平方和,n 是顺序总数,若算得 值的绝对值大于等级相关系数临界值表(附表四)中的 值,则认为两现象间存在显著的关系,否则,认为它们之间不存在显著的关系。

1 82 74 8 2 75 71 4 3 81 80 1 4 89 85 4 5 82 76 6 6 89 77 12 7 88 77 11 8 84 68 16 9 80 74 6 10 87 74 13

则认为两事物关系不显著,否则认为关系显著。

可查附表四(P382)得到。

例如表4-8 是某校男生和女生对八种职业的选择顺序(选择人数最多的职业排第一,以此类推),我们可知 = 8, n = 8, 据公式(4.15)算得:

又查等级相关系数临界值表得 = 0.833, 所以可以认为,该校男生和女生对八种职业的选择顺序存在极显著的关系,或者说男、女生对八种职业的选择顺序比较一致。

表 4-8 某校学生对职业的选择顺序

20

本文来源:https://www.bwwdw.com/article/7qtx.html

Top