心理测量

更新时间:2024-06-02 07:32:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

重点掌握 心理测量

第一章 心理测验的总论

第一节 心理测量的历史

一、心理测量在我国有着悠久的历史 (一)我国古代的心理测验 1、能力测验

汉代学者董仲舒 论及到注意测验―一手画方,一手画圆,莫能成。‖这无疑是世界最早的心理(注意)测验;自6世纪中叶 ―周岁试儿‖是最早的婴儿发展测验;清朝出现的益智图(通称七巧板)、九连环可以认为是最早的创造能力测验 2、人格测验 3、教育测验

(1)世界上最早的教育测量出现于中国西周奴隶制时期。

西周奴隶制时期(公元前1100~前771年)的―国学‖中的教育测验制度:

?规定了学业考试的时间和步骤——每隔一年进行一次;规定了考试的内容和标准。

(2)汉代在考试制度、考试类型和考试功能方面都作了重要的发展。 (3)隋唐的―科举制‖

(二)民主革命时期测验运动的发展

1921年,廖世承和陈鹤琴正式出版《心理测验法》一书;1932年《测验》杂志创刊。 (三)心理测验在科学的春天中复苏

从1978年北京大学首建心理系开始,心理测验才重新得到恢复;1989年,成立中国心理学会心理测验专业委员会,标志着中国心理测验已进入了一个新的高速发展时期 二、 科学心理测验的产生与发展 (一)心理测验的产生是社会的需要

1、治疗智力落后者和精神病人的需要2、人员选拔与职业指导的需要 (二)心理测验起源于个别差异的研究 (三)心理测验的早期尝试

高尔顿 (Francis Galton)卡特尔(J.M.Cattell)

1.早年留学于德国,从师冯特(w.Wundt),深受其影响。

2.编制测验五十个,包括测量肌肉力量、运动速度、视听敏度、重量辨别力、反应时、记忆力以及类似的一些项目。

3.于1890年发表的《心理测验与测量》一文,首创了―心理测验‖这个术语。 比奈:科学心理测量的创始人

1904年比内与西蒙合作编制成了世界上第一个科学的智力测验--比内-西蒙量表。(为了鉴别弱智儿童) 1905他在《心理学年报》上发表了文章《诊断异常儿童的新方法》,介绍了该量表,历史上称为―1905量表‖。 比内-西蒙量表宣告诞生。比内和西蒙主持两次修订,一次在1908年,一次在1911年,此时比内已不幸去世。 1908年量表,删除1905年量表中不满意的题目,增加题目数量,按年龄水平分组1911年量表,在若干年龄水平组增加一些题目

4.推孟修订的斯坦福-比纳量表,首次采用智力商数(intelligence quoient,IQ) (四)心理测验的发展

二十世纪四、五十年代,心理测量快速发展,测验的形式和品种也有了不断的创新:

1,操作量表 2. 团体测验扩大了测验的应用范围 推孟的研究生欧提斯编制的团体智力测验 3. 能力倾向测验的发展 4. 教育测验 — 桑代克教育测量的鼻祖,1904 出版《心理与社会测量》 ; 斯腾教育测量的

创始人,1908 年编制了第一个标准化教育测验 5. 人格测验 6. 特殊能力测验

三、心理测验的发展特点

(一)先是以解剖生理特征为根据,而后转向对心智活动的测量。 (二)由测量简单的感知能力,发展到测量复杂的认知能力。

(三)由笼统的单一量数以评定个别间差异的观念,转变为以多个量数兼顾个别差异与个别内差异的观念。

(四)心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了。

第二节 心理测验(测量)的性质

―凡客观存在的事物都有其数量‖ (桑代克,1918年) ―凡有数量的东西都可以测量‖。(麦柯尔,1923年)

一、 测量(测验)的基本问题 1、测量的定义

? 测量:是根据一定的法则、使用量具用数字对事物的特征加以确定的过程。 测量的对象和目标: ―事物及属性‖;

测量的规则和方法: ―一定的法则‖,指的是在测量时所采用的规则或方法。 代表某一事物或某一事物属性的量:数字; 2、测量的要素

(1)参照点:指计算的起点。(存在两种类型:一是绝对的零点;二是相对参照点。) (2)单位: 单位是测量的基本要素,没有单位就无法进行测量。(好的单位须符合两个条件:有确定意义;有相等的价值)

3、测量的量表

量表 :就是有参照点和单位的连续体。

? 类别测量--只能对事物进行分类,具有区分性. ? 等级测量--能把事物分等,具有等级或序列性.

? ?

等距测量--能把事物作等距的分等,具有等距性.

比率测量--能测量事物差异的比例关系,具有可加性.

不同水平的测量使用的统计方法也不同。 类别测量 次数,百分比,?2,列联相关

等级测量 中位数,百分位数,等级相关,秩次检验 等距测量 均数,标准差,积矩相关,T检验,F检验 比率测量 几何均数,等比量 四种测量在三个维度上的表现 绝对零点 相等单位 大小关系 类别 无 无 无 等级 无 无 有 等距 无 有 有 比率 有 有 有 二、 心理测验的概念 (一) 心理测量与心理测验

1. 心理测量:即依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一

种数量化的价值。

2. 测验 :―测量一个行为样本的系统程序‖ (布朗) 。

3. 心理测验:心理测验实质上是行为样本的客观和标准化的测量。(Anastasi 心理测验的三要素

? 行为样组:一个能代表全域的样本

? 标准化 :测验编制、实施、评分、解释的一致性程序

? 客观性测验:不受主观性支配;测验方法是可以重复的;测验的实施、记分和解释是客观

的。

(二)心理测量属于哪一种水平的测量

心理测量的水平: 一种等级量表,但是实际操作中当成是等距量表。 三、心理测验的性质 【思考题一】 ◆把心理测验同物理测验等量齐观,是导致人们对心理测验产生种种误解的原因。心理测验与物理测验有同也有异,总的看来,心理现象比物理现象更复杂,更难以测量。 ◆心理测验的主要性质 间接性 相对性 客观性 ㈠间接性 ◆科学发展到今天,我们还无法直接测量人的心理活动,只能测量人的外显行为,也就是说,我们只能通过一个人对测验项目的反应来推论出他的心理特质。 ⒈特质是个人对刺激作反应的一种内在倾向。独有的(与他人不同)、稳定的(表现于多种情境)、可辨别的(与其他特征分开)特征。 它又是一个抽象的产物,一个构想,而不是一个被直接测量到的有实体的个人特点。 ⒉由于特质是从行为模式中推论出来的,所以心理测量永远是间接的。 ⒊心理测量的误差一方面来自测量工具、测量过程,另一方面是由于其间接性,即测量对象大部分不能直接测量。 图解 心理特征——行为——行为取样——测量 ㈡相对性 ◆在对人的行为做比较时,没有绝对的标准,我们有的只是一个连续的行为序列。 ◆结果的评价:都是与所在团体的大多数人的行为或某种人为确定的标准相比较而言的。 ㈢客观性 ⒈客观性是对一切测量的基本要求。 ⒉测验的客观性实际上就是测验的标准化问题。 ⑴测验量表的标准化:测验用的项目或作业、施测说明、施测者的言语、态度及施测时的物理环境等的标准化,保证测验的刺激是客观的。 ⑵评分计分标准化,保证对反应的量化的客观性。评分方面的客观性随测验种类和项目类型而异。一般说来,投射测验的客观性差些,而选择题的客观性较好。 ⑶分数的转换和解释标准化,保证对结果的推论的客观性。测验分数转换表是通过对总体的代表性样本的测试确定的,测验的有效性也在一定程度上经过实践的检验,依据这些资料所做出的解释,自然较为可靠。 心理测验的客观指标——信度和效度;难度和区分度 第三节 心理测验的种类与作用 一、心理测验的种类 1.按测验的功能分类

能力测验(测量一个人所具有的能力和潜在能力)

学业成就测验(测量一个人对知识和技能掌握的程度) 人格测验(测量一个人的性格、气质、兴趣、态度、 需要、品德、情绪、动机、自我、价值等个性心理特征

2.按测验人数分类

个别测验(测验者和被测者一对一)

?优点:对被试的反应有较多的观察和控制机会。结果比较可靠;缺点:时间不经济 团体测验(一个测验者同时测量多个被试)

?优点:时间经济,对主试要求不高;缺点:被试在测验中的行为不宜控制。结果不一定可靠。

3.按测验材料分类

文字测验(纸笔测验)——缺点:受文化程度的影响

操作测验——缺点:不能团体测试,因而时间上不够经济。 4.按测验的目的分类

筛查测验(大致了解人的心理特征)

? 优点:快速,简便;缺点:结果比较粗糙,不够准确

诊断测验(精确确定人的心理特征)

? 优点:结果比较精确可靠 二、心理测验的作用

(一)心理测验在实际工作中的应用:人员选拔和分配、心理障碍的预测和诊断、在评价和咨询 (二)心理测验在理论研究中的应用

1.搜集资料 2.建立和检验假说 3.实验分组

(三)心理测验在教育领域中的应用

1、心理测验是实现科学教学和学习的良好辅助工具

2、心理测验是开展教育研究和改革的重要手段 第四节 正确对待和使用心理测验

—、对测验的错误看法:测验完美无缺、测验无用且有害 二、对测验的正确态度

(一)测验是研究心理学的一个重要方法和作决策的辅助工具。 (二)测验作为一个研究手段和测量工具尚不完善。

(三)为了更好发挥测验的效能,必须防止测验的乱编滥用。 1.测验的编制和修订要注意科学性 2.测验的出版和发行要严加控制 3.测验使用者要具备一定的资格

?测验使用者:受过专门训练的心理学工作者,教育工作者或医生 ?测验使用者(主试)在使用心理测验时必须做到 :

(1)测验的选择要慎重。

(2)使用某一心理测验前,必须认真阅读测验手册。 (3)做好测试前的准备工作。 (4)测验的实施应严格控制误差。 (5)测验的记分要客观。

(6)要以慎重的态度来解释与使用测验结果。 4.要学习和宣传测量理论

第二章 心理测验的编制

第一节 编制测验的一般程序

一、 确定测验的目的

1.测验的用途:为什么而测?

描述、诊断、选拔或预测-----影响取材范围及试题难易度

2.测验的目标——即要测什么?另外还要将目标具体化

心理测验的目标:是指编制的测验是测什么的,即测什么样的心理特征或人格特点。 (1)确定目标:能力、人格、学业等 (2)将目标具体化

?按照某种理论及个体对该心理结构的理解,概括出一个或多个能代表该心理结构的行为,然后―虚构‖出能表征这些行为的项目。

?或确定能够表征所欲测量的心理结构的行为或行为样组

(3)确定每一类行为的项目比例

?项目比例确定的问题其实就是确定每一类行为在心理结构中的比重问题。 3.测验的对象

?即测谁?确立了对象才能考虑测验的内容和形式. ?对象的年龄、智力水平、社会经济和文化背景

如何确定(选择)真正有代表性的行为样组? (1) 回顾以往研究的成果。(2)考虑时代特点。

(3)了解受测群体实际情况:所依理论的可行性、发现理论所没有涵盖的具体问题内容 (4)向有关专家、资深者咨询和请教。

二、 制定编题(编制)的计划 (一)编题计划—— 双向细目表

编题计划:就是编制测验的蓝图,指出测验所包含的内容和要测定的各种技能,以及对每一个内容、技能的相对重视程度。

(二)测验计划有两个用途

?在编题阶段,测验计划指出应该写多少和哪些种类的题目; ?题目编好后,可按计划进行检查;

?在记分时可按表中百分比确定每类题目的分数。注:双向细目分析表的查看

三、设计(编辑)测试项目或题目

(一)搜集有关资料——任何测验都要考虑的几条原则:1.材料要丰富—齐全、有代表性。2.材料要有

普遍性—公正性(被试的年龄、文化)。

(二)选择项目形式:形式影响测验的内容,所以要从测验的对象,功能等方面考虑测验项目的形式。

1.项目(项目)的形式

选择型: (1)判断题.(是非题)如:长江是我国第一大河流 对 错

优点:命题容易、评分简单省时、被试回答方便

缺点:只适合考查被试对简单观念或知识的了解;鼓励被试去记忆无关的知识,忽略教材的重要部分;被试还容易猜测分数受机遇影响教大,可靠性自然也就差。

编制时的注意事项:A.每一个题目只能包含一个概念; B.避免具有暗示性的字词; C.题目的表述要简洁明确; D.各种答案的测题数量大致相等;E.测题要有一定的数量.F.避免使用可能导致歧义或没经过界定的词。

?如:总是、都、没有一个、决不、只有、仅仅、许多、很少。

(2)选择题:包括题干和选项两部分. 例: 美国的阿拉斯加是向哪个国家买来的?

A.俄罗斯 B. 英国 C. 法国 D. 加拿大

优点:适用范围广(它既可以适用于文字和数字的材料,也可以适用于图形材料);评分简单、省时、客观,相比是非题它更少受猜测的影响

缺点:编拟迷惑答案比较困难;无法测量出被试的言语表达能办和概括、组织能力;猜测的影响仍然不能完全排除。

题的被试在总分上的平均分 p = 该题的难度 (通过该题人数百分比)q = 1-p(未通过该题人数百分比) St = 全体被试的总分标准差

例2: 15个学生某测题的得分与总分情况,计算该测题的区分度. 表2-6 15名学生总测验分数与某一题分数 学生 总分 某题 解

1 1 2 0 3 1 4 1 5 1 6 1 7 1 8 0 9 0 10 11 12 13 14 15 0 1 0 1 0 0 90 81 80 78 77 70 69 65 55 50 49 42 35 31 10

(3).φ 相关

(4).四分相关

(5). 项目和总分相关重叠的校正

当测验项目超过20个项目时,校正法通常毫无意义。

注:项目反映理论

项目测验回归曲线—— 一般,被试总分高,在试题项目正确作答的概率也高。如此,沿着被试总分的由低到高,对试题项目正确作答的概率形成一条不降曲线,这就是试题项目正确作答率对总测验分数的回归曲线

项目特征曲线:人们用能稳定反映被试水平的潜在特质量表分数代替被试试卷总分数作为回归曲线的自变量,并把求得的被试在试题上正确作答概率对潜在特质分数的回归曲线称为项目特征曲线。

项目特征曲线描述了潜在特质分数(效标分数)不同的被试在该项目上的通过率。曲线坡度越陡,鉴别力越好,预测的误差越小。

(三)项目的区分度的相对性

?采用不同的计算方法区分度的值不同。 ?用相关法计算的区分度值受样本大小影响

?用两个极端组通过率的差异作为区分度的指标,其值受分组标准的影响。 ?区分度值的大小与样本的同质性有关

三 、 难度和区分度的关系

1. 难度和区分度都是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在

的。

? 较难的项目对高水平的被试区分度高, ? 较易的项目对水平低的被试区分度高, ? 中等难度(P=0.5) 的项目对中等水平的被试区分度高(D=1)。

2. 若P=1.00或 0.00 ,则D=0 3. 若P=0.50 。 则D=1 四、 测验项目分析实例 (一)项目分析步骤

1.选取有代表性的样组( N人)实施测验.2.计算每个人的总分,然后按总分分组.

3.计算高分组和低分组通过每一题的比率,分别以PH和PL表示。4.分别求出每一测题的难度(P)和鉴别指数(rb 、 D).5.选项分析.6.修改测题或选项 (二)项目实例分析

1. 难度 P 值在0.35~0.65 (0.2~0.8)之间为好 2. 区分度 D值在0.3(0.2)以上.

3. 选项分析

选项设置不当会降低题目的难度,所以也要对选项作分析,看有无异常情况. 通常判断选项好坏有以下几点:

1) 正确答案无人选或少于其它选项的人数.2) 错误答案选的人太多.

3) 正确选项高分组选择人数少于低分组.4) 错误选项上高分组选择人数多于低分组.5) 选项无人选择. 6) 未答人数较多

4. 找出原因,对各题进行修改 五、标准参照测验的项目分析 (一)概念

1. 标准参照测验:参照某种特定的标准解释个人测验分数的一种测验;是用来测量学习

前后被试的差异或受过训练与没有受过训练被试之间的差别.;测验结果只与既定标准比较而不在被试之间比较.

2. 常模参照测验——用常模作为解释个人测验分数的参照标准的一种测验。 (二)标准参照测验的项目分析所采用的方法

1.以达标与否分组,然后计算两组被试在每一题上的成绩差异,算出难度和区分度.

公式(难度) : (区分度): D=Ps – Pn ((Ps、Pn为达标组与未达

标组在某一项目上的通过率 )

2.教育效果敏感指数公式:

第三章 测量的误差及其检验

第一节 测量的误差

一、 误差的种类——就是在测量中与测量目的无关的因素所产生的不准确的或不一致的结

果。

误差的类型:随机误差(这是由与测量目的无关的偶然因素引起而又不易控制的误差);系

Ppost 前测的通过率 Ppre后测的通过率

统误差 [这是由与测量目的无关的变因引起的一种恒定而有规律的(效应)误差。] 二、误差的来源(一)测验工具(二)施测过程(三)被试引起的误差。 三、真分数理论(True Score) (一)真分数的定义 1、(理论)所谓真分数就是一个测量工具在测量没有误差时,所得到的真值(纯正值)。 2、(操作定义)真分数是,经过无数次测量所得的平均值。 ?数学公式:

(二)真分数理论的基本定理

定理一:实得分数是真分数与误差分数之和。

(3.0)

定理二:真分数与实得分数的平均数相等。

定理三:误差分数的期望值为0。

定理四:真分数和测量误差的相关为零。 PTE=0 定理五:不同测量误差之间的相关为零。 PE1E2=0 定理六:测量分数的方差等于真分数方差和误差之和。

S2x=S2T+S2E ( 3.1 )公式3.1只涉及到随机误差的变异,系统误差的变异包含在真分数的变异中。

S2T=S2V+S2I (3.2)

S2V是与测量目的有关的(亦即有效的)变异数,由所要测量的变因引起的 S2I是与测量目的无关但却是稳定的变异数,由其它变因引起的。

将公式(3.2)代入公式(3.1)得到如下公式:S2x= S2V+S2I+S2E (3.3) 一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和随机误差变异数所决定的。 第二节 测验信度

(一)信度的基本定义——信度指测量的一致性或可靠性程度,是测量结果的稳定性程度。

信度的操作化(等价)定义

定义一:一组测验分数的真实变异与总变异数(实得变异数)的比率。即: rxx=S2T/S2X (3.4) 式中rxx代表测量的信度,S2T代表真分数的变异数,S2X代表实得分数的变异数。

该定义有两点要注意:信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性;真分数的变异数是不能直接测量的,因而信度是一个理论上构想的概念,只能根据一组实得分数作出估计。 定义二:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。 即: rxx=P2TX 定义三:信度乃是一个测验X(A卷)与它的任意一个―平行测验‖X′(B卷)的相关系数。 其中,定义一和定义二只具有理论意义,定义三则具有实际意义。

真变异数还可以分成两个部分,与测量目的有关的变异和与测量目的无关的变异,即

(二)信度的意义

1、信度系数直接告诉我们测量的误差有多大。

它可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。

2、 信度系数可以解释个人测验分数的意义

3、 测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测 XT=X± 1.96SE

(三)信度系数:大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关作为测量

一致性的指标,称作信度系数。最理想的情况是rxx=1.00m,但这是办不到的。 一般能力与学绩测验的信度系数在0.90以上;

性格、兴趣、价值观等人格测验的信度系数,通常在0.80到0.85或更高些。 当rxx< 0.70时,测验既不能用于对个人作出评价或预测,也不能做团体间比较。 当0.70≤rxx<0.85时,可用于团体比较。

当rxx ≥0.85时,才可以用来鉴别或预测个人成绩或作用 对信度系数也要注意三点 1)一个测验有多个信度系数——在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。

2)信度系数只是对测量分数不一致性程度的估计,并没有指出不一致的原因。 3)信度系数是使测验有效的一个必要条件。

二 、信度评估的方法

(一)重测信度

1、重测信度指的是用同一量表对同一组被试施测两次所得结果的一致性程度(求两次得分间的相关系数)。(有时也叫稳定性,主要针对时间变量) 形式:施测—适当时间—再施测 2、重测信度采集数据得方法是:对同一组被试间隔一定的时间重复测试一次。 3、重测信度的计算方法是积差相关法(r)

4、 使用的前提条件:A 所测量的心理特性必须是稳定的。B遗忘与练习的效果相同:对儿童的智力测验

一般是两周到四周为宜;对成年人,间隔可到半年,很少超过6个月。 C两次实测期间被试的学习效果没有差异 5、 优缺点

a) b)

优点:能提供测验结果是否随时间而变化的资料,可作为预测将来行为的依据。 缺点:容易受练习和记忆的影响。

(二)复本信度

1、含义:以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数(复本信度反映的是测验在内容上的等值性,故又称等值性系数。形式:复本A—最短时间—复本B 2、 数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关(rxx) 3、使用条件

各份测验测量的是同一种心理特性。 各份测验具有相同的内容和形式。

各份测验的题目不应重复。 各份测验题目数量相等,难度和区分度大体相同。 各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。 4、优缺点

(1)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。

(2)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应

(三)分半信度

1、含义:是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

2、 数据采集方法是:将一个测验分成对等的两半给被试实测,求两半数值的相关。这个相关系数就代表了两半测验内容取样的一致程度 (1)Sa2=Sb2,斯皮尔曼-布朗公式 rxx?2?rhh1?rhhrxxrhh为 一半分数的相关系数 测验在原长度时的信度估计值—

(2)Sa2≠Sb2 ①弗郎那根公式: r=2[1-( Sa2+Sb2)/ Sx2] Sa2、Sb2为两半测验的变异系数;Sx2为总分变异系数。 ② 卢伦公式: rxx = 1-Sd2/Sx2

Sd2是两半测验分数之差的方差;Sx2为总方差。

(四)同质性信度

1、同质性信度是指测验的所有题目间性质的一致性。(测的是同一种心理特质或行为;题目间呈高正相关 。

2、计算方法及使用范围(1)基本公式

项目间相关系数的平均数 K 构成测验的项目数 (2)库德和里查德森提出的K-R20公式

使用条件: K-R20公式只适合预测题目是二分法计分 (3)克伦巴赫α系数

使用条件:适合于非二分法计分的测验的内部一致性信度估计法 α系数的公式

例如:某态度量表共7题,100个被试在各题上得分的方差是0.81,0.82,0.79,0.83,0.85,

0.76,0.77,测验总分的方差是14.00, 求此测验的 信度? 解:∑S2i=0.81+0.82+0.79+0.83+0.85+0.76+0.77=5.63 S2x =14.00 ? ? ??1?k?1??K?SSx22i????

=0.70

(五)评分者信度

1、评分者信度是指不同评分者之间在测验结果计分上的一致性。 一般要求评分者之间平均一致性达0.90以上,才认为评分是客观的。 2、应用范围:作文、创造力、投射、道德判断等测验

3、计算方法

(1)如果是两个评分者,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算 。 (2)评分者在三人以上,而且是等级评分,则可以用―肯德尔‖(W)来求评分者信度。

解:分别求出各篇论文的等级之和Ri,依次为8,12,3,14, 17,6。 则有 ∑Ri =8+12+3+14+17+6=60

∑R2i=64+144+9+196+289+36=738

K=3 N=6

信度系数与误差来源 信度系数类型 再测信度 复本信度(即时) 复本信度(延迟) 分半信度 同质性信度 评分者信度 一个假想测验的误差变异来源分析 信度类型 复本信度(间隔施测) 分半信度 上述二者差异 评分者信度 误差变异总和 真实变异 真实变异 误差变异 评分者间差异 时间上的稳定性,复本之间内容取样误的一致性,评分者之间的一时间取样误差 差 致性 62% 20% 10% 误差变异量 1-0.70=0.30 1-0.80=0.20 0.30-0.20=0.10 1-0.92=0.08 0.20+0.10+0.08=0.38 1-0.38=0.62 误差变异来源 时间与内容取样 内容取样 时间取样 评分者差异 误差方差 时间取样 内容取样 时间取样和内容取样 内容取样 内容取样和内容异质性 评分者之间差异 8% 三、影响信度的因素【思考题二的补充】 (一)有被试的样本特性 1、样本团体得分分布的影响(样本团体得分分布如果比较窄小,相关系数的信度就低。 ) 2、样本团体异质性的影响(样本团体异质大,信度就高;实际上,高信度可能是假性高信度,可能是由样本团体的异质造成的。) 3、 样本团体平均能力水平的影响。(团体的平均得分太高或太低,同样会使测验分数的分布比较窄小,低估信度。) (二) 测验的长度 1、测验越长,即题目越多,测验的内容取样就越有可能有代表性。 2、测验越长,被试的猜测因素影响就越小(公式教材52页)。 (三) 测验的难度 a) 如果测验过难,被试的得分会集中在低分区。 b) 过于容易,分数则集中在高分区。 c) 两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。 (四) 测验的时间间隔

(时间因素之对重测信度和不同时测量时的复本信度有影响。) 【思考题二:提高测验信度的方法:】

1)增加题目数量2)难度适中3)内容同质4)程序统一5)时间充分6)评分客观 四、信度的作用

1、 解释预测个人分数的意义。

两个作用:其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。人们一般采用95%的概率水平,其置信区间为:

公式1 公式2

例如:在一次测验中有些学生得80分(已知该次测验的标准差为5,信度系数为0.84 ),如果再测一次他们的分数将改变多少? 解:Sx=5 rxx=0.84 有公式1得: 2

T=80±1.96*2=80±3.92=76.08~83.92

我们可说这些学生的真正分数有95%的可能性落在76与84分之间。即若再测一次,他们的分数低于76、高于84的可能性不超过5%。 2、两种测验分数的比较。 差异分数的标准误公式为:

公式3

差异的标准误 S 相同尺度的标准分数

分别为两个测验的信度系数

标准误差定义为各测量值误差的平方和的平均值的平方根

例如:某班期末考试,张生语文、数学的成绩转换成T分数分别为65和70,由在此我们可以知道张生的数学比语文考得稍好些,若采取95%的置信区,间二者差异是否有意义? (假定此次语文,数学考试的信度系数分别为0.84和0.91,张生的两个分数转化成T分数后,其标准差为S= 10 ) 解: rxx= 0.84 ryy=0.91 S= 10 由公式3得:5

采取95%的置信区间(即.05显著水平),则张生在这两门课上了分数的差异必须达到或超过1.96SEd=1.96×5=9.8。

因为数学的T分数只比语文高5分,所以差异并不显著。

3、新编的测验信度应高于原有的同类测验或相似测验。

4、下结论说某测验比较可靠,必须是依据情境的,经多次证实的。 5、它是确定测验好坏的一个指标。 第三节 测量的效度 一、效度概述

(一)效度的定义

1、操作定义:效度是指测验能测量到所要测量的对象的程度。 测验测量什么?

测验对测量目标的测量精确度和真实性是多少?

2、理论定义:效度是与测量目标有关的真实分数方差与总方差的比率。 (二)效度的性质

1、效度是针对测验结果的。

2、效度具有相对性(效度是针对某种持定的测验目的的)。

3、效度具有连续性(效度只有程度上的差异)。

4、效度也不是直接就可以测量到的,它是从已有的证据推理而来的。 (三)信度和效度的关系

1、差别:两者所涉及的误差不同

? 信度仅考虑偶然的随机误差占测验总变异的比例,

? 效度既有随机误差,还包括与测验无关的但稳定的测量误差。

2、联系(高信度是高效度的必要条件,而不是充分条件)

效度是受信度制约的

信度是效度的必要条件,但不是充分条件。

要想一个测验的效度高,其信度必须得高;但信度高,效度未必高。 注:

二、效度的估计

1966年美国心理学会在《教育心理测验值标准》中将效度分为三大类:内容效度(Content

Validity);结构(构想)效度(Construct Validity)效标效度或实证效度(Criterion related Validity) (一) 内容效度

1、定义:内容效度是测验题目对有关内容或行为总体取样的适当性程度。这种效度主要是考察测验的内容,因此叫内容效度

测验的内容效度高,必须又两个条件。

测验内容的范围或行为总体必须界定名确(双向细目表);测验题目取样必须代表了内容总体。

2、确定内容效度的方法

(1)专家评定法(又称―逻辑效度‖logical validity)。 ——最常用的方法 评定步骤(54页) 专家评定法的缺点

1) 没有量化指标;2) 对内容效度的判断不一致;3) 教育思想或心理学观点不同,所以对内容范围的理解也不同。

提高内容效度的方法之一:编制命题的双向细目表

(2)统计分析法

复本法:由一组被试取自同样内容范围的两个测验复本上得分的相关。相关的高或低,较难确定内容效度的高低。 再测法

(3)经验法(一般来说,高年级比低年级的水平低,如果总分和题目随年级而增高,则说明测验对教学具有内容效度。) 3、表面效度

表面效度是指测验看起来所要测量的东西,是被试或外行看来是有效的测验. 表面效度与内容效度并不总是一致的.

表面效度能间接影响测验的效度,所以测验编制时也要适当关注表面效度. 例如,最高行为的测验要求有较高的表面效度

职业兴趣测验、成就测验均应该重视测验的表面效度。 对人格测验而言,高度的表面效度是不合适的。

在人格测验中就不一样了。为了引出被试的真实反应,测验编制者并不希望被试了解人格测验的目的。

4、内容效度的应用

?适合于成就测验、职业测验 ?编制任何测验都要考虑内容效度 ?标准参照测验中,内容效度更为重要

(二)构想效度(结构效度)

构想或结构:指用于解释人类行为的理论框架或心理特质,它是心理学中抽象的假设性的概念、特性或变量。

1、构想效度的含义、特点及应用范围

构想效度的含义:测验能够测量到理论上的结构或特质的程度;或指一个测验实际测到所要测量的理论结构和特质的程度;或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。 特点

(1)构想效度的大小首先取决于事先假定的心理特质理论 (2)当实际测量的资料无法证实我们的理论假设时,并不一定就表明该测验构想效度不高(3)构想效度是通过测量什么、不测量什么的证据累积起来给以确定的,因而不可能有单一的数量指标来描述结构效度。

应用范围(主要用于智力测验、人格测验等一些心理测验方面) 2、确定构想效度的基本步骤

建立理论框架;提出各种可能的有关的假设;检验假设是否成立。

例如,韦氏智力测验就是根据这3步来确立结构效度的。 智力因素理论

假定―智力是一个人去理解和应付他的周围世界的总的才能‖

编制了11个分测验(WAIS—R)或12个分测验 (WISC—R),从十几个方面来说明智力测验编好以后,许多研究者便从众多角度研究了它的效度。用因素分析方法得出的结论是,该测验实质上测量了三类共同因素,即A因素(言语理解因素)、B因素(知觉组织因素)和C因素(记忆和注意集中因素)。

3、收集构想效度资料的方法(1)测验内方法(2)测验间方法(3)效标关联 (4) 实验操作

(三)效标效度或实证效度

1、效标概述

(1)效标是反应测验目的的行为参照,或者是衡量一个测验是否有效的外在标准, (2)效标种类(阿斯丁把效标分为两个层次)

一是理论描述水平的―观念效标‖ (是一个概念) ,二是操作定义水平的―效标测量‖ (对观念效标的量化),效标测量必须能真正反映观念效标。

(3)常用的效标(学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级评定。) (4)一个好的效标必须具备的条件 理想校标的几个条件:

相关性:即校标与目前所评价的事物有相关,并适用这一校标来度量。如评价一个英语测验的校标效度,就不能用被试在语文测验的分数作为校标。

有效性:校标与所测的特质之间应该是高度一致的。如一个测验X被用作测验Y的校标,那么应有证据表明测验X是有较高的信度和效度。

无污染:校标的度量不是基于或部分基本正在评价的测验的结果。 就我们正在评价一个抑郁量表的校标效度,我们就不能选择根据在这一量表的得分或部分根据在这一量表上的得分筛选出来的病人作为校标。

客观性:效标可以客观地加以测量,可用数据或等级来表示; 实用性:效标测量的方法简单,省时省力,经济实用。

2、效标效度

(1)效标效度是指测验总分数与外在标准(效标)之间的相关(一致性)程度。 反映的是用测验预测个体在某种情境下行为的表现如何的有效性程度。 (2)效标效度种类

?同时效度(它的效标资料是和测验分数差不多同时搜集的。) ?预测效度(效标是经过一段时间以后才获得的。)

3、效标效度的评估方法

(1)相关法(2)区分法(分组法)(3)预期表法(4)命中率法

(四)内容效度、构想效度和效标效度的几点总结 1、效度问题的研究基本上是两个问题

(1)测量什么东西,即测验所测量的变量性质是什么; (2)测验对它所测量的东西达到何种程度

?

内容效度研究的问题是变量的内容范围;同时,它又决定测验分数能否代表某种学习结果的成果,也是关构想效度能帮助我们运用测验分数解释人的心理特质,回答测验所测量的东西或所测量的变量的性质; 效标效度可用来了解测验分数能否有效地预测或估计某种行为表现,是关于测验结果的一些实际用途的检

于测验结果的一些实际用途的检验。

??

验.

2·任何一个测验都需要各式各样的效度证据,关键在于效度是由一定的测验目的规定的。 3.效度的验证通常是测验编制好之后进行的工作,但效度的基本指导思想在测验编制过程中始终起着主导作用。

?效度的观念与测验编制过程是紧密关联的,它比信度更为重要,测验的最终目的还在于效度。

???

内容效度验证的重点是确定测验内容与某个行为领域的一一对应关系;

构想效度的着重点则是测验本身、测验编制的心理结构理论和测验测量到该理论结构或特质的能力; 效标效度着重于测验分数是否与效标测量有高度的相关。

三、影响效度的因素【思考题三的补充】

(一)测验本身的因素 1.测验材料必须对整个内容具有代表性;2.测题设计时应尽量避免容易引起误差的题型(如是非题);3.测题难度要适中,具有较高的区分度;4.测验长度要恰当,即要有一定的测题量;5.测题的排列按先易后难顺序。 (二)测验实施中的干扰因表

1、主试的影响因素2、被试的影响因素 (三)效标的性质

1.校标的选择。(一个测验有多少个用途,就可以根据多少个校标来进行效度分析。) 2.测验与校标之间的关系类型。(计算校标一般用积差相关法,这要求要求测验与校标分数之间都应是正态,而且二者是线性关系。但有的不能满足,如曲线相关。) 效标测量的信度。(效标测量的可靠性即效标测量的信度。) (四)干预变量(由于无关变量的影响,测验在不同团体中有不同的效度。) 年龄、性别、种族。如女性中智力测验分数与学习成绩的相关高于男生。 【思考题三:提高测验效度的方法】

1、精心编制测验2、妥善组织测验3、扩充样本组的容量和代表性4、保证较高的信度 注:

第四章 分数的合成与解释

第一节 分数的合成 一、分数合成的种类

项目的组合:将测验的每个项目的分数组合起来,合成一个测验总分.

分测验或两表的组合:将一个测验的各分测验分数组合到一起得到一个测验总分(韦克斯勒量表) 测验或预测源的组合:几个测验分数的组合(高考录取新生的分数组合方法)

二、分数的合成方法:临床判断法、推理法、多重分段法、多重回归法、合成分数的特殊方法 (一)临床诊断----直觉合成

1. 临床诊断—直觉合成:通过直觉经验,主观地将各种因数组合得出结论或预测的方

法。(对一个人的高考志愿的判定)。 2. 条件:接受任何种类的材料:定性与定量的,连续与不连续的。

3. 优缺点:优点:具有高度的综合性和灵活的针对性 。

缺点:主观加权易受决策者的偏见影响,不够客观;缺乏精确的数量分析;没有精确的数量指标,判断者需要受过训练并具有丰富的经验。

(二)推理法

1. 使用条件:各个测验所测特质间有相互代偿作用;这些测验上的分数又是连续性资料,并能大体同时获得(如学生各种考试成绩)。

2. 方法:单位加权——最简单的加权方法:就是将各个测验分数直接相加而获得合成

分数。公式4-1

等量加权:将各所有分数转化为标准分数(Z)分数,然后再将它们相加。(使用于各测验对预测效标具有同等重要性的场合)公式4-2

(三)多重分段(划分)

1. 多重分段:在各个特质(测验)上都有确定一个标准,从而把成绩划分为合格与不

合格(通过与未通过)两类,只有每个测验都合格时,总要求才算合格。(研究生考试、招工考试等)

2. 使用条件:连续或非连续数量的资料;各预测源所测的特质不具互补性 3. 多重分段的模式

综合分段(高考对成绩、身体、品德评定):各预测源分数能同时得到,几个变量没有确定

的阈限。将几个预测源与效标的关系综合起来考虑,在保证合成体的预测效度最高的前提下,分别确定出每个预测源的最高分数线。

连续栅栏:由于成功的被试必须越过一连串测验的栅栏,所以叫―连续栅栏)。各预测源分数不能

同时得到,几个变量有自己特定的阈限。被试只有通过第一项测试,才能进行下一个测试,所有测试通过才算合格。组合分数时应注意:首先,使用最有效的预测源(最有效的预测源放在测验的最前面)然后,使用第二个有效的预测源,依此类推。

4.优缺点:优点:资料要求不苛刻,容易操作。

缺点:对分类而非连续测量,失去了精确性;对可以接受的人选没有名次排列。 (四)多重回归法

1. 使用条件:同时采用几个预测源来预测一个效标,而且预测源变量间又具有互补性;预测源分数与效标分数之间存在线性关系;预测源分数与效标分数同时取得。 2. 多重回归:研究一种事物或现象与其他多种事物或现象在数量上相互联系或相互制

约的统计方法。 (1) 基本回归方程式

? 从公式可以看出:一个预测源的低分数,可以由另一个预测源的高分数来弥补。 ? 多重回归方导出的结果:回归方程式,指出了各预测源的加权数;多重相关系数R,表示预

测源与效标测量间的相关;R2表示效标的变异可由预测源来解释的比重。

(2)多重回归方程导出的作用

根据一个人的各预测源分数,利用回归方程,可以得到一个人的效标分数。

预测误差

3.渐进效度

4.多重回归法的优缺点

优点:可以导出一个人的效标分数;各种能力的组合可以接受;有利于选拔不同的人才 缺点:预测源与效标分数不成直线关系,回归法很难作出预测。 第二节 分数的解释

分数的解释包括两个问题

一是如何使分数有意义:常模参照分数(发展量表、商数、百分等级、标准分数);

标准参照分数(内容参照分数、结果参照分数)

二是分数的解释与交流

? 原始分数:直接从测验上得到的分数。

计算公式:求总分

实质:所有的项目被看成是对同一个东西的测量,并等同看待所有的项目。

? 原始分数只反映了被试答对某题的个数或正确的程度

? 原始分数不能反映被试间差异情况

? 原始分数不能说明被试在其他等值测验上的分数

? 导出分数:通过统计方法由原始分数转化到量表上的分数(有一定的参照点和单位)。导出分数有:常模参照分数和标准参照分数

一、常模参照分数

(一)常模参照分数

1、常摸1)常模——解释测验结果的参照指标,即标准化样本测验分数的 平均分数或分数构成的分布,就是通常所说的常模(norm)。2)常模有一般常模与特殊常模之分。 2、常摸参照测验(用常模作为解释个人测验分数的参照标准的一种测验。)

3、常模参照分数1)——常模参照分数:就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。

【思考题五】2)常模参照分数有:发展量表;商数;百分等级;标准分数

(二)常模团体的性质

1、常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 2、常模团体的条件(群体的构成必须明确界定;常模团体必须是所测群体的代表性样本;样本的大小要适当;标准化样组是一定时空的产物(时间性);一般常模与特殊常模的结合 3、取样的方法——取样即从目标人群中选择有代表性的样本。 (1)简单随机抽样(2)系统抽样(3)分组抽样(4)分层抽样 4、常模的表示方法——常模表和图示法

(1)常模表

常模表——把原始分数与某一种或几种量表分数的关系制成表。(这种表示常模分数分布的方法是最常见的。)

常模表有三个要素:原始分数、导出分数、常模样本的特征描述。

常模表:A. 简单转换表;B .复杂转换表。(a.几个原始分数在一张表中转换成量表分b.把同一个原始分在不同测验中的量表分列在一张表中。) (2) 图示法就是剖面图法。(把测验结果以图的形式呈现,直观地呈现分数。) (三)发展常模(量表)

?

人的许多特质,如智力、技能等是随时间而发展的,所以可以将一个人的成绩与各种发展水平的人的平均在量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。

成绩相比较,制定出发展量表。

?

?发展量表:是以年龄或年级当量为单位度量个人某些心理特质的发展水平的一种工具。

?所测的心理特质是随时间有系统地发展变化;此量表只使用于儿童;种类:年龄量表、年

级当量

(四)商数

(3)存在的问题

第一个困难是在计算高年龄组儿童的智商时应该用何实际年龄作为除数,尚无一定的结论。 第二个困难是智力生长曲线,因而以智龄作为发展水平的单位就不是一个等距单位,这显然给求智商带来了困难 。如果各年龄组的标准差编制得不相等,则一个儿童所得到的智商在各年龄不相同。

(五)百分位常模包括:百分等级;四分位数(quartiles);十分位数(deciles)。

1、百分等级(一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比;百分等级指出的是个体在常模团体中的相对位置,等级越低,个体所处的地位越差。 2.四分位数(是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个点分成的四段。) 3、十分位数——是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与9个分割点上相对应的数据称为十分位数。

优点:使不同的测验结果可以比较;易理解;对于各种被试和各种测验普遍适用。

缺点:单位不相等,特别是分数的两端;靠近平均数或中位数的原始分数的差异在转化为百分等级时被夸大,而接近分数两端的原始分数的差异在在转化为百分等级时被缩小;百分位无法说明被试间差异的原始分数量大小。 (六)标准分数

1、线性转换的标准分数

(3)标准分数的优缺点

优点:可以进一步运算;可比较两个不同测验的分数。

标准分数的缺点:计算依据比较复杂的统计原理,难以使不懂统计的人理解;有负数,应用不便,而且单位太大;原始分如果畸变,标准分不能使分布有所改进。

非线性转换的标准分数的形式:T分数、标准九分数、离差智商(IQ)等。 T分数

当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数,即:T=50+10× Z (公式4-8)

优点:单位等距;可以对两个不同的测验分数进行比较;使测验分数成常态分布.

3、标准分数的评价

优点:用等距量表示测验分数,是进一步统计分析成为可能;常态标准分数可参照常态曲线面积表直接转换为百分等级,易理解;可以将几个测验或量表上的分数作直接比较。 缺点:统计复杂;实际应用中,没有区分常态化的还是线性转化的分数;常态化标准分数是人为使分数呈常态分布。 4、正态分布与标准分关系 二、标准参照分数

标准参照测验:格拉塞于1963年首先提出的。它是直接向人们报告被试完成什么测验题,能拼多少单词,能做什么样的逻辑推理题等。

标准参照分数:1.内容参照分数2.结果参照分数 (一)标准参照测验

1.标准参照测验与常模参照测验的不同之处在于1)分数地位:常模参照测验的分数反应了一个人在所属群体中的相对位置;标准参照测验的分数标志一个人能力或知识的绝对水平。 2)参照点:所以常模代表了某一群体的真正水平,而标准则是希望达到的目标,它有很大的人为性。

标准参照测验在对测验结果进行评价时,是根据特定的操作和行为领域为标准,对个体作出是否达标或达到什么程度的判断,它不与其他人的分数比较

2. 结果参照分数——结果参照又叫效标参照,是用效标行为的水准来表示的分数。 1)期望表 表示一个原始分数获得不同效标分数的机会有多大。

期望表的制作是先对测验分数和效表分数分组,计算出测验分数与效标分数每一种组合的人数

2)预期的效标分数 将每一个测验分数可能得到的效标分数用图或表格的形式呈现出来。 及其比例,再制成表格即可。

【思考题八】三、解释测验分数的原则

(一)解释测验分数的原则

1、测验分数须用所测量的真正特质来解释(瑞文—智商,SCL90—心理健康) 2、解释测验分数必须考虑被试的具体状况(文化背景,情绪状态)

3、必须充分估计测验的常模和效度的局限性4、解释分数应参考其他有关资料5、测验分数要以分数区间来解释6、对来自不同的测验分数不能直接加以比较7、要让当事人知道如何运用他的分数。 (二)报告分数

1、使用当事人所理解的语言;2、要保证当事人知道这个测验测量或预测什么;3、要是当事人认识到分数只是一个估计;4、要让当事人知道分数比较的标准;5、要使当事人知道如何运用他的分数6、要考虑测验分数将给受测者带来什么影响;7、测验结果应向无关的人员保密;8、对低分数者的解释应谨慎小心;9、报告分数时应设法了解当事人的心理感受。

【思考题四:人格测验中投射测验各有何特点及不足】

1、投射测验的特点:使用的刺激材料没有明确结构和固定意义,被试有广泛自由的反应方式;测验目标具有掩蔽性;解释的整体性。关注人格的总体评价而不是单个特质的测量。 2、投射测验的评价:

优点:投射测验采用独特的思路去研究和评价人格,探索内部深层的机制,更符合人格的特点。

缺点:评分缺乏客观标准,难以量化;缺少充分的常模资料,测验的结果不容易解释;信度和效度不容易建立;原理复杂深奥,非专门训练者不能使用。

补充——A、罗夏墨迹测验完整图谱:以各种不同形状的图形,对各种不同受试者测试,最后选定具有代表性的十张,作为模棱两可刺激情境的测验题目之用。不同的受试者,面对墨迹图形时,必定会表现出不同的反应 B、逆境对话测验 C、句子填充测验

【思考题六:成就测验与智力测验、能力倾向测验有何区别】

共同点:测量对象都是认知性特质。

这三种测验都是测量个体从与环境的相互作用经验中发展出来的能力。所以在本质上,它们所测量的也可以看作一种―成就‖。 区别:

1、就测验的对象而言。成就测验测量的是一些特定的、限定于某一范围的能力和知识,而另两者所测验的则为一般性的、较为广泛的能力。

2、从功能上看,成就测验也不同于智力、能力倾向测验。

成就测验则是评估被试在接受一些教育或训练程序后所获得的学习成果,它的实施发生在教育、训练过程后。后两者的主要功能是预测一个人在未来的教育、训练或工作经验中可能的表现,它们的使用是在教育或训练程序以前,用以反映被试是否有接受某种课程或专业技能训练的能力。

3、在测验的技术品质上,成就测验要注重内容效度,而能力倾向、智力测验则必须有较高的预测效度,否则就失去其基本价值。

【思考题九:成就测验的功能】

考查和报告学习成就、筛选和安置、诊断、评估教育计划或教育质量。成就测验可以用于评估某种教学法和教学程序的功效,以作为改进教材和教法的参考。 【思考题七:根据某儿童的韦克斯勒儿童智力测验结果,如何向当事人写一份测验结果的解释和建议】

结合“测验结果的报告”这一知识点作答: 即

1、测验结果综合分析 :首先,根据心理测量的特点进行分析—被试测验的分数是在一个范围内波动;不能把分数绝对化,决不能根据一次测验的结果下定论;主试本人更应该对测验分数有一个正确的认识;

2、测验结果的解释和建议:将被试的总智商、语言智商和操作智商分数作出相应的等级评定;根据各分测验所测能力指出被试的优势和不足;针对不足提出补救措施,同时也可以提供一些建议以使被试优势得以更好发挥;

注意:一般而言,不要把测验结果直接告诉家长和被试,而只需告之测验结果的解释;在针对结果进行解释时,应对测验过程中出现的异常情况,如被试的健康、情绪、态度等;建议不要采用绝对化语言,妄下定论。

【思考题十分析传统智力测验的若干问题】

一、传统智力测验的结构效度

1、传统智力测验是建立在智力G因素论基础上的。

2、各种智力理论研究方向之间的结合。

二、传统智力测验的功能:对智力个体差异的测量;预测的功能;诊断和评价功能 三、传统智力测验公平性

1、性别差异

2、职业差异:不同职业的人在智商具有差异.

在当代社会,职业分工日益精细,不同职

业需要不同的能力是一个公认的事实。而传统智力测验并不能全面反映人的各个方面能力,因此仅以智商高低来判断人的智愚并不充分。

3、文化和教育的差异:个体在测验上的得分往往受知识经验的影响,因此对不同文化背景或教育水平的团体是不公平的。 四、传统智力测验的预测效度

本文来源:https://www.bwwdw.com/article/s5l6.html

Top