0144《教育测量与评价》2013年6月期末考试指导

更新时间：2023-12-25 21:46:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

0144教育测量与评价期末考试试卷推荐度：
相关推荐

0144《教育测量与评价》2013年6月期末考试指导一、考试说明（一）考试说明

满分为100分，考试时间为90分钟，考试形式为闭卷。（二）可能包含的题型及各题型相应的答题技巧 1. 判断题

答题技巧：只有对、错之分，判断错误不能得分。一般题目错误处较为明显，遇到不易判断的题目时，注意从细节处去判断题干正误。 2. 简答题

答题技巧：答出讲义与课件中的重要知识点要点即可。 3. 论述题

答题技巧：答题时注意结合相关的知识点，首先找到题目对于的知识点，再阐述自己的对其的认识，然后围绕此观点展开论述，一般来说，最好分几个方面谈对某一问题的认识和看法，需要比较详细的展开论述。

说明：本考试指导只适用于201303学期期末考试使用，包括正考和重修内容。指导中的章节知识点涵盖考试所有内容，给出的习题为考试类型题，习题答案要点只作为参考，详见课程讲义或笔记。如果在复习中有疑难问题请到课程答疑区提问。最后祝大家考试顺利！二、复习重点内容

第一章教育测量与评价的学科发展 1. 测量的要素

测量的量具、测量的单位和测量的参照点，是测量的三个基本要素或三个基本条件。 2. 教育测量和教育评价的定义教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统地收集资料信息，对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。 3. 教育测量的特点

由于教育测量主要是测量学生的内在心理特性，因此，它具有与物理测量不同的特点。主要有：间接性和推断性；测量对象的模糊性和测量误差的不可避免性；量表具有多样性，结果具有相对抽象性。 4．教育评价的特点

教育评价是根据一定的目的和标准，采取科学的态度和方法，对教育工作中的活动、人员、管理和条件的状态与绩效，进行质和量的价值判断。它具有以下特点： ⑴教育评价的对象具有广泛性； ⑵教育评价具有间接性； ⑶教育评价具有客观性； ⑷教育评价具有综合性。

5. 教育测量与教育评价的联系与区别

教育测量和教育评价既有各自相对独立的发展空间，也有许多相互交叉、逐步融合的领地。具体而言，两者的联系表现在教育测量是教育评价的基础，教育评价则包括了教育测量两方面。但是教育测量与教育评价也存在一定的区别，主要表现为：

（1）教育测量定量地描述所要实现的教育目标或目标实现的程度，而教育评价是对教育活动、教育系统工作情况进行的价值判断；

（2）教育测量是对测量标准的参与回应，而教育评价则是对评价标准的参与回应；（3）教育测量是定量的表述，而教育评价是定性的表述；

（4）教育测量结果以多或少的数量表示，而教育评价则以合理、不合理、适当、不适当，好、不好、优、劣等表示

第二章教育测量与评价的类型和功能 1. 教育测量与评价的类型

（1）按测评在教学中运用的时机分类：形成性测量与评价、诊断性测量与评价、终结性测量与评价。

（2）按解释测评结果时的参照点分类：常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。（3）按测量与评价的内容分类：智力测量与评价、能力倾向测量与评价、成就测量与评价、人格测量与评价。

（4）按照测量与评价被试行为表现的性质分类：最佳行为测量与评价、典型行为测量与评价。

（5）其它分类：按测量对象可分为个别测量与评价和团体测量与评价；按测验材料可分为文字测验和非文字测验；按量具的标准化程度可分为标准化测验和非标准化测验。 2. 教育测量与评价的主要功能（1）实现教育判断；（2）改进教师教学；（3）促进学生学习；（4）行使教育管理。第三章教育测量与评价的质量特性 1. 信度的定义

信度，简单地说就是测量结果的可信程度，指的是测量结果的稳定性或一致性程度。记为rxx。具体地说，测验的信度是指同一组学生用同一测验实施两次后所得分数的一致性，或者同一组学生经过一次测验后，用另一个同质的测验再测一次，这两次测验所得分数的一致性。

2. 信度的估算方法

（1）重测信度：也叫稳定性系数，指的是用同一个量表，对同一组被试施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数。

（2）复本信度：指的是两个平行测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的相关系数。

（3）同质性信度也叫内部一致性信度指测验内部所有题目间的一致性程度。题目间的一致性有两层意思，其一是指所有题目测的是同一种心理特质，其二是指所有题目得分之间都具有较高的正相关。

（4）评分者的信度：指的是多个评分者给同一批被试的答卷进行评分的一致性程度 3. 提高测验信度的方法

（1）适当增加测验题目的数量；（2）测验的难度要适中；（3）测验的内容应尽量同质；（4）测验的程序应统一；（5）测验的时间要充分；（6）评分要尽量做到客观化、减少评分误差；（7）应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数，从而影响信度。引起应试者参加测验的强烈动机，提高其积极性，使其保持旺盛的精力，都对提高测验信度有一定作用。 4. 效度的定义

效度是指测量结果的准确性和有效性的程度，亦即测量是否达到了预期的目的。

每当进行教育、心理之类的间接测量的时候，必须考虑是否测量到了所要测量的东西，在多

大程度上测量到了这些东西。也就是说，必须考虑测量的效度问题。在效度和信度之间，首先要重点保证是高效度，因为，高效度必然高信度；反之，则不然。特别是对于教育测量而言，效度问题显得更为重要。 5. 效度的类型

（1）内容效度：指测验目的代表所欲测量的内容和引起预期反应所达到的程度。也就是测量内容的代表性程度。

（2）效标关联效度：又可称为经验效度或统计效度，是以测验分数和效标之间的相关系数来表示测验的效度的高低的。效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的变量，作为检定效度的参照尺度。效标关联效度又可分为同时效度和预测效度。同时效度是指测验与当前效标之间的关联程度；预测效度是指测验与将来的效标之间的关联程度。例如，用全国高考的成绩作为效标来检验高中毕业会考的成绩，计算两者之间的相关系数就是会考的同时效度；而用大学一年级的成绩作为效标来检验高考的成绩，计算两者之间的相关系数就是高考的预测效度。

（3）结构效度：指一个测量能实际测量出理论上的构念或心理特性的程度。它的目的在于用心理学的概念来说明分析测验分数的意义，也就是说从心理学的理论观点就测验的结果加以解释和探讨。这里的结构的含义是心理学理论所涉及的抽象而属假设性的概念、特性或变量，如智力、焦虑、机械能力倾向、成就、动机等。 6. 难度

难度指被试完成测验或量表时所遇到题目的难易程度。测验题目的难度必须根据测验的目的确定和评价。

（1）难度对测验的影响：影响测验分数的分布状态、影响测验的鉴别能力。

（2）影响题目难度的因素：考查知识点的多少、考查能力的复杂程度或层次的高低、考生对题目的熟悉程度、命题的技巧、利用经验判断或者通过预测调整难度。 7. 衡量测验质量的四个指标作为教育测量的工具—测验，它的编制是一项十分复杂的工作，它需要懂得一些教育测量基本知识和基本方法的人来完成。从教育测量的理论上来讲，一个良好的测验应该具备恰当的难度和区分度，具备较高的信度和效度，也就是说，测验的信度、效度、难度和区分度是衡量测验质量的基本指标。其中，前两个指标主要是对整个测验而言，后来两个指标主要是对测量的项目而言。 8. 效度的分类

1974年美国心理学会发行的《教育和心理测验的标准》一书将效度分为三大类：内容效度、效标关联效度和结构效度。

第四章编制教育测验的一般原理与方法 1. 教育目标分类

（1）布卢姆等人的教育目标分类法：教育目标分为认知领域、情感领域和动作技能三个领域。认知领域的目标细分为知识、理解、运用、分析、综合和评析六个主要类别。情感领域的目标分为接受、反应、赋予价值、组织和形成品格五个类别。动作技能领域非常复杂，分类不完善，有克布勒（1970）、辛普森（1972）、哈罗等人（1972）的分类。

（2）加涅的教育目标分类法：教育目标分为智力技能、认知策略、言语信息、运动技能和态度五种能力。智力技能细分为辨别、概念、规则、高级规则四类。态度领域分为情感因素、认知因素和行为后果三个类别。认知策略、言语信息和运动技能不再细分。 2.布卢姆的认知领域的目标分类

布卢姆将认知领域的目标分为六个类别，按照由低级到高级的难易程度形成一种递进的等级关系，前一类别是后一类别的基础，后一类别又涵盖了前面的类别。

(1) 知识/知道。这是最低等级的认知目标。此处的知识是指对具体事物和普遍原理的回忆，对方法和过程的回忆，或者对一种模式、结构或框架的回忆。

(2) 领会。这是最低层次的理解，指个人把某种材料与其他材料联系起来，也不必弄清它的最充分的含义，便知道正在交流什么，并能够运用正在交流的这种材料和观点。

(3) 运用。运用是指将抽象的概念用于特定的和具体的情境。这些抽象的概念，可能是以一般的观念、程序的规则或概括化的方法等形式表现出来的，也可能是那些必须记住的和能够专门运用的原理、观念和理论。

(4) 分析。分析是指把材料分解成各个组成部分，弄清各部分之间的相互关系及其构成的方式，以指出那些用来传递意义或确定交流结果的技术和手段。

(5) 综合。综合是指将各种要素和组成部分组合起来，以形成一个整体。它是对各种要素和组成部分等进行加工的过程，是一个用这种方式将它们组合起来，以构成一种原先不那么清楚的模式或结构的过程。

(6) 评价。评价是指为了某种目的，对观念、作品、答案、方法和资料的价值及符合准则的程度作定量和定性的判断。准则既可以是内在证据，如逻辑上的准确性、一致性等，也可以是外部准则，如根据挑选或回忆出来的相应领域的最高标准等。 3.测验题目类型与测量功能

若根据被试作答的范围和评分方法不同，又可分为主观性试题和客观性试题。客观性试题主要包括选择题、匹配题和供答题中的填空题、简答题等，一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观题的评分标准客观、具体，但是它所能考查的内容具有一定的局限性。主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标，尤其是适合于测量综合、评价等目标层次。 4、如何确定测验的题型？

答：测验题目是测验的基本构成元素，题目编制恰当与否直接关系到整个测验的质量，正确地选择合适的题型并编制出高质量的试题，组成高质量的测验试卷。首先，要根据学科类型和测验目的选择使用主观性或者客观性试题。第二，要根据测验考察的教学目标选择题型。第三，要根据被试的特点选择题型。 5.题目反应理论与经典测验理论题目反应理论认为，一个人的行为举止就好像处于自身某些心理品质的定量控制之中，可以通过一组题目定量地估计个体在每一种特质上的位置。反之，可用所估计到的特质的量去预测和解释个体在相应情境中将会产生的行为反应。与经典测验理论相比，题目反应理论在以下方面取得突破。第一，参数比较稳定。经典测验理论使用的题目分析法所得的题目统计量数受样本的抽样影响较大。而题目反应理论的方法具有局部独立和参数独立等特点，题目参数估计是独立于被试样本和题目样本，因而后者的参数比较稳定。第二，能力的比较。经典测验理论对被试能力间的比较只能在相同的测验或平行复本的情况下进行。而题目反应理论是自适性测验或电脑自适应测验，它的处理较方便且灵活。

第三，平行复本难实现。经典测验理论最基本的概念是测验的信度。而信度的设定来自平行复本的假设。但事实上平行测验是很难达到的，被试不可能在两次测验中得到完全相同的结果。影响测验结果的因素很多，如遗忘、学习新知识技能、动机及焦虑程度等。经典测验理论常依赖平行复本的假设，所以研究者在现实实施中只能接受下限的信度估计或具偏差的信度估计。

第四，缺乏预测力。经典测验理论无法预测被试在一个新的测验中可能的表现。而题目反应理论使用概率的观念来表示被试能力与项目的关系表示具有某种能力的被试答对某题的概

率P。

第五，测量标准误。经典测验理论是假定所有被试的测量标准误都是相等的。事实上，不难发现，不同能力组表现在测验上的稳定性是不同的。如施测几个复本，可能高能力组比中能力组稳定性高。良好的测验模式应能针对某一测验得分或被试能力进行精确的估计，不同的得分或能力有其不同的概率误差，而非统一的测量标准误。

除此之外，经典测验理论在测验的设计、偏误题的认定、测验的等值问题上还没有得到满意的解决。

第五章教育测验的常模及其建立方法 1. 教育测量数据的特点教育测量的数据，本质上不同于物理测量的数据，不能直接套用相应于物理测量数据的方法：（1）教育科学研究中绝大部分数据属于等级变量。（2）教育测量的多数数据从本质上说是主观的。（3）教育测量的数据还具有随机性。（4）教育测量的数据也具有模糊性。 2. 常模参照测验与标准参照测验在教育与心理测验中，可依据解释测验分数的参照点不同，把测验分成常模参照测验和标准参照测验。即参照测验的常模，对测验的分数进行解释与评价的测验，称为常模参照测验；参照测验的“标准”，对测验的分数进行解释与评价的测验，称为标准参照测验。在教育常模参照测验中，使用标准分数必须满足一定的条件，即常模数据服从正态分布的假设。（加） 3．年级当量

某一特定群体所处的学校年级水平，其给定的分数是这一总体的分数分布的中位数。第七章制定教育评价表的一般方法和步骤 1. 教育评价表

教育评价表是根据教育教学的特性编制而成的，它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具，为了使评价的结果更为可靠，需要对教育评价表进行更深入的研究。 2. 教育评价表的构成要素

（1）评价指标：就是根据评价的目标，由评价指标的设计者分解出来的，能够反映评价对象某方面本质特征的具体化、行为化的主要因素，是对评价对象进行价值判断的依据。（2）指标权重：就是表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这个数值就叫做对应指标的权数，或叫做权重。

（3）评价标准：衡量评价对象达到评价指标要求的尺度，是由强度和频率、标号、标度三个要素构成的。

3. 常见的指标权重分配方法 (1)关键特征调查法

关键特征调查法是先请被调查者从所提供的备择指标中找出最关键、最有特征的指标，再对指标进行筛选并求出其权重的方法。

其操作步骤包括：①提出备择指标。②请被调查者从备择指标中找出一定数量的关键指标。③计算人数和百分比。④按一定的规则选取指标。⑤计算各指标的权重系数： (2)两两比较法

为了确定各指标的权重，可对指标进行逐对比较，并加以评分，重要者记为1分，次重要者记为0分；然后分别计算各指标得分之和，再除以所有指标得分之总和。这种方法叫两两比较法。

(3)专家评判平均法对于已经确定的指标，分别请专家评判其权重，然后以专家评判结果的平均数作为各指标权

重。这种方法叫专家评判平均法。这种方法的特点是简便易行，能够充分交流意见。不足之处是：主观随意性较大，容易受专家的素质、水平等因素的影响。因此，要保证权重确定的合理性和准确性，使确定的权重具有一定的信度和效度，关键在于专家的素质和水平。 (4)倍数比较法

对已确定的指标，以每一级指标中重要性程度最小的指标为基础，记为1，然后将其他指标与它相比，作出重要性程度是它多少倍的判断，再经归一化处理，即获得该级各指标权重。这种方法称倍数比较法。 (5) Q分类法

Q分类法是一种确定指标优先顺序及其权重的方法。总的方法是将写有指标名称的一套卡片交给被调查者，请他们按指标重要性程度分组。优点：简便易行，在指标数目较多的情况下，更为适用准确性较低。缺点：准确性较低。第八章学生评价 1. 学生评价的类型

（1）定位性评价：又称安置性评价、预备性评价，主要是在特定的教学活动之前，判断学生的前期准备。在这种评价里面要解决的问题是学生是否已经掌握了参加预定活动所需要的知识和技能，在多大程度上已经达到教学目标，学生的兴趣等基本情况等等。

（2）形成性评价：主要是指不断地反映学生学习成功或者是失败的信息，特别注重强化学生学习的成功之处，显示学生学习过程中需要改进的具体的错误。

（3）诊断性评价：诊断性评价对学生的学习进行进一步的评价，对于学习中错误的深层诊断。

（4）总结性评价：在某个期末教师对学生的测验和评价。对教学目标达到程度的判断，同时也提供教学目标适当性和教学策略有效性的信息。 2. 现代学生评价的特点

（1）强调了评价功能的形成性。

现代教育评价在其目的上，十分强调参与和推动教育的发展。现代的学生评价，主要是用来诊断问题，改进教育，其目的则是创造适合儿童的教育。对评价形成性功能的重视又反过来成了现代教育评价发展的一个重要动因。（2）重视评价内容的全面性。

教育工作者要求评价须全面地反映教育目标，对学生认知、情感以及动作技能的发展做出全面的评价，以促进学生的全面发展。因而，评价活动对教育活动能提供更大的帮助。（3）重视评价类型的多样性。根据现代教育的需要，现代教育评价注意为教育提供全方位的服务，逐步地发展了包括定位性评价、形成性评价、诊断性评价在内的多种评价。这种多样性的评价，在学校教育的不同阶段提供不同的评价服务，使得评价在推动教育的发展中能起到越来越大的作用。 3. 学生评价原则

（1）发展性原则：学生评价要围绕学生的发展，为学生的发展服务，这是发展性原则的核心思想。

（2）全面性原则：学生评价要紧扣教育目标，全面地反映教育目标。学生评价不全面，必然会把学校教育引向片面。（3）明确性原则：评价的目的要明确，评价的要求也要明确，这是明确性原则的基本涵义。（4）过程性原则：学生评价作为促进学生发展的工具，要贯穿学生学习活动的全过程。要充分利用定位性评价、形成性评价、诊断性评价与总结性评价的不同功能，在学生学习的各个过程提供各种不同类型的评价服务。 4. 课业考评的参照系

无论是相对评价还是绝对评价，要使其结果更有意义，就需要为学生课业发展评价寻找一个参照点。概括地讲，课业考评过程常见的参照点类型主要有个人发展参照、教育目标参照和教育常模参照三大类，其中每一类又可分若干种不同的方法。这些不同的方法有其不同的使用对象和范围。

评价学生课业发展进步的个人发展参照法，常用的有下面三种方法：个人发展纵向参照、个人发展横向参照、个人潜力发展参照。评价学生课业发展进步的教育目标参照法。评价学生课业发展进步的教育常模参照法。评价学生发展的教育常模参照，可以采用年级常模参照、年龄常模参照、百分等级常模参照、分等评定常模参照、标准分数常模参照等。 5. 评价学生课业发展进步的主要方法根据格朗兰德以及李聪明等人的观点，教育评价就是尽可能地利用测量的和非测量的技术方法来评定教育效果，做出价值判断。为了改进对学生课业发展的评价，我们应当学习与掌握多样化的教育评价技术与方法，这些方法包括客观题评价法与主观题评价法、表现性测验评价法、评定量表评价法、同伴评价和轶事记录评价法、档案袋评价法、动态评价法以及学习能力评价法。

6. 学生认知过程的基本能力

观察能力、记忆能力、思维能力和想象能力。 7. 人格的主要内容

人格即指人与社会性联系最为密切的心理特质的总和。人格特征可以是外在的，也可以是隐藏在内部的。人格的形成是由先天的遗传因素和后天的环境和教育因素相互作用的结果。人格是在先天遗传因素的自然基础上形成和发展的，又主要由个体的生活史所决定，它受社会历史条件的影响。所以说人格很重要的方面是自我与现实之间的和谐，以及自我和理想的自我之间的和谐。

人格有其不同的侧面，通常包括：

（1）气质：是每个人独特的行为心理特征，它决定于人的高级神经活动，是人格形成的心理基础。

（2）性格：指人与社会价值相联系的人格特点。

（3）适应性：指人与外界协调的程度。强调个体对环境的适应，认为个体在适应环境的过程中形成的独特适应方式也就是人格的内涵。（4）兴趣：指人寻求参与特定活动的意向。

（5）态度：指人对其周围各种现象表示喜爱或拒绝的意向心。 8. 现代社会中具有健康人格学生的特征在现代社会中，青少年学生所具有的健康人格应是：能客观地认识自我和外部世界；开放的；对所承担的学习和其他活动有胜任感；充分发挥自己潜能；对父母、朋友有显示爱的能力；有安全感；喜欢创造；有能力管理自己的生活；有责任感等。 9.智力测验

对人的智力进行客观的标准化的测量。它是通过一组标准的刺激物引起被试的反应，根据这些反应来度量被试的智力高低。这种标准的刺激物称为量表。

不能完全根据智力测验的分数来看待一个人的智力水平。

分数仅仅是一个参照，还要经过多方面的综合，在使用这个分数时要慎重。这个分数可以看出一个人的潜力。智商与成就是两码事。

10.经典智力观与传统智力测验之间的联系与区别

智力的定义多种多样，但有两点是共同的：首先，都认为智力是一种能力。其次，都认为智力是与认识活动有关的能力，换言之，智力是直接影响认识活动的效率，使认识活动任务得以顺利完成的心理特征。由于对智力的不同理解，导致了不同的智力结构理论。智力测验是对人的智力的一种客观的、标准化的测量。它以一组标准刺激物引起被试的反应，根据这些客观反应来度量被试的智力高低。可以说，传统的智力测验实际上是经典智力观的具体构想，在不同的智力观指导下编制的智力测验也不相同。任何一个智力测验都只可能测出某种智力观所认为的智力因素，被试在某个测验上的智商分数最多反映了他在该测验所提出的智力结构因素上的优劣。另一方面，相同的智力观也可以由不同的智力测验展现出来。所以，智力观和智力测验既有联系又有区别，正确理解两者的关系有利于我们合理地认识和解释智力测验的结果。第九章教师评价 1. 教师评价的模式

（1）教师职责评价模式；（2）教师认知发展评价模式；（3）教师活动评价模式 2. 教师评价的类型（1）成果评价。（2）教学行为评价。（3）素质评价。 3. 教师评价的方法，如何处理不同评价方法之间的关系。

有多种途径可用于教师评价：自我评价、家长评价、学生评教、同行评议、书面材料的收集与观察以及教学成果等等。目前常用的教师评价方法主要有教师自评、学生评教、同行评议以及观察与会谈等。在以上评价方法中，教师自评是教师评价中一个重要的方面，这不仅因为它是收集必要的信息的一个途径，而且因为它也是教师自我诊断的一个重要方面。在一定意义上，甚至可以说，教师自我评价的过程就是教师自我激励与自我提高的过程。

在这多种资料的收集途径中，学生对课堂教学的评价也是最有力的材料。同行评议不仅在形成性评价中有很大的潜在价值，而且对在教师中创造一种专业发展的气氛也有重要意义。使用同行评议这一方法的基本观点，是在评价教师能力方面同行具有较大的发言权。

现场观察在教师评价中一直占有重要的位置，因为它具有相当的可靠性。但研究表明，课堂观察的可靠性与有用性，直接地依赖于观察者在观察之前所掌握的信息量与信息的类型。在实践中还没有任何一种方法，已被证明对总结性的判断来说，已达到必要的信度的要求。然而，多渠道地收集信息，有助于提高评价的信度。第十章课程方案评价 1. 课程方案评价的内容（1）课程计划的评价；（2）学科教学大纲的评价；（3）教材的评价 2.课程方案评价的基本模式 (一) 梅特费赛尔模式

强调课程评价的持续性和课程的全面整体效果，包括八个步骤： 1、使教育团体的全体成员直接或间接地参与课程编制和评价活动；

2、提出宽泛的教育目的和具体目标的范例，并对结果按一般到具体的等级顺序加以排列； 3、将以上具体的目标转换成适应于教学方案实施的目标；

4、设计标准测量必需的方法，使个体能借助判断方案的有效性得出相应的结论；

5、用测验、事例以及其他适当方式对课程方案实施的整体效果进行持续性的定期观察； 6、用适当的统计方法收集、分析资料；

7、根据反映课程哲学思想的特定标准和价值观念解释资料；

8、根据有关信息提出建议，进一步实施和修改课程方案；强调目标的宽泛性，在泰勒基础上发展出来的模式。（二）CSE评价模式

1、需要评定；核心是确定教学目标。

2、方案计划;核心是对各种被选方案达成目标成功的可能性作出评价；可分解为两个：选择和修定方案；

3、形成性评价；重点发现教育过程中的成功和不足之处； 4、总结性评价；

特点：1、旨在为教育改革提供服务的评价模式；

2、评价的形成性功能和总结性功能得到了有机的统一； 3、这是一种动态的评价； (三) 反对者模式四个阶段：

1、争论的提出阶段；确认需要加以评价的问题； 2、选择议题； 3、辩论的准备； 4、听证； (四) 应答模式

斯塔克提出的，通过评价者与同教育活动有关的各种人员的接触，了解他们的愿望，把它同实际活动进行比较，对教育决策或立案做出修改，对大多数人的愿望做出应答，以使教育满足各种人的需要。

强调多元现实性和价值观念的发散性。 (五) 消费者导向模式斯科利文提出的。

做出评价的依据是活动参与者的意图，是一种较民主的评价模式。 (六) 自然探究模式

认为人所生活的世界是由人、事、时、地、物不断交织而成的世界。假设：1、社会实体是多元的，实体之间是相互关联的； 2、研究的主题和客体是交互影响的； 3、知识是个案化的结果； 4、同时性的构建； 5、价值牵连；特点;

1、自然情境的研究；2、以人为研究工具；3、重视隐约的知识；4、采取质的研究方法；5、目的性取样；6、以归纳法处理有关资料；7、根据据实理论的研究取向；8、逐步形成的研究设计；9、暂时性的研究结果；10、个案式的深度分析11、个案性的解释；12、暂时性的推论与应用；14、非约定俗成的效标；此外，在西方现代教育评价理论中，还有医疗模式、费用一效果分析模式、分析软件包模式、EPIC模式、CEMREL模式以及爱特金森模式等等。第十一章教学工作评价 1. 发展性教学评价基本认识：（1）教师唱主角的课不是好课；（2）面面俱到的课不是好课；（3）没有教师教学机智的课不是好课（4）只是“教教材”，没“用教材教”的课不是好课；（5）中评不中用的课不是好课。

原则要求：（1）强调以学生为中心；（2）强调情境对师生发展的重要作用；（3）强调师生交往的积极意义；（4）强调“协作学习”对有效教学的关键作用；（5）强调利用各种信息资料支持学（非支持教）；（6）强调教学形式的个别化；（7）强调教学目标的灵活性 2. 网络教学评价的评价要素（1）对学习者的评价；（2）对教师的评价；（3）对教学内容的评价；（4）对网络教学支持平台的评价；（5）对网络学习支持与服务系统的评价。 3. 学校办学水平的评价

学校办学水平的评价包括办学条件、办学水平、社会评价和获奖情况等四方面的评价。教学工作评价应该注意的问题（一）工作的量和质的关系问题

工作的量是指教学工作中所付出的劳动量。

考虑基本教学工作量和超工作量的情况；考虑教师工作量安排不均的情况；教学工作的质是指教师完成教学工作的好坏或者优劣程度。应有机统一教学工作的质与量。他人评价与自我评价的关系问题

他人评价是指他人对教师工作过程及结果的评价，包括同行教师、学生、领导、社会等的评价；是一种外部的显性评价。

自我评价是内隐性的，有时也具有外显性。

自评可以弥补他评的某些局限，他评也弥补了自评的不足，所以要相互结合。第十二章学校办学评价 1. 学校办学评价的特点（1）地区性。（2）综合性。（3）复杂性。 2. 学校办学水平的评价

学校办学水平的评价包括办学条件、办学水平、社会评价和获奖情况等四方面的评价。第十三章现代教育测量与评价的发展趋势 1.题目反应理论是在如下的假设中建立的

假设1：一维性(即考生的某一测验结果只取决于一种潜在特质或称能力，其他能力的影响均可忽略)；

假设2：局部独立(即考生答题时不受其他试题影响)；假设3：适合的数学模型(须经拟合度检验)。三、重点习题（一）判断题

（） 1、教育测验可以按照分数解释的参照体系不同，分成常模参照测验与标准参照测验两大类。

（） 2、正确使用测验结果的关键是要认识到教育测量与评价的有限性。（） 3、在成就测验中得分高的学校是好学校。

（） 4、教育评价的主要功能就是甄别和选拔，通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动，确保学校教育教学工作的正常进行。（） 5、现代测量理论是在经典测量理论的基础上发展起来的，修正了经典测量理论的不足，所以现代测量理论可以完全代替经典测量理论。

（） 6、当测验对某一团体过难或过易时，该团体的分数范围将会缩小，信度也就会随之降低。只有当测验难度适宜时，团体的测验分数才会分布最广，测验信度才会达到最高。（二）简答题

1. 衡量测验质量的四个指标分别是什么？

2. 如何确定测验的题型？ 3. 教育评价有哪些特点？

4．列举提高测验信度的主要方法？ 5. 测验的题目主要有哪些类型？（三）论述题

1. 教师评价的方法，如何处理不同评价方法之间的关系。

2. 列举评价学生课业发展进步的主要方法，并就其中的一种评价方法进行简单分析？四、重点习题参考答案（答案仅供参考）

说明：本部分内容只给出了重点习题答题要点，学习者需要参在此基础上，结合教材中对题目相关知识点的描述，补充和完善内容并组织答题语言。（一）填空题

1、度量单位的相对性测量对象的复杂性 2、顺序量表区间量表 3、选择型供答型 4、泰勒

5、局部独立适合的数学模型（二）判断题 1、（√） 2、（√） 3、（×） 4、（×） 5、（×） 6、（×）（三）简答题

1. 衡量测验质量的四个指标分别是什么？【答题要点】围绕以下要点进行展开：

（1）衡量测验质量的四个指标分别是信度、效度、难度和区分度。（2）分别展开解释这四个概念的含义。 2. 如何确定测验的题型？【答题要点】：基于以下要点展开阐述：测验题目是测验的基本构成元素，题目编制恰当与否直接关系到整个测验的质量，正确地选择合适的题型并编制出高质量的试题，组成高质量的测验试卷。具体列出三项依据元素。 3. 教育评价有哪些特点？【答题要点】：围绕以下要点进行展开：

教育评价是根据一定的目的和标准，采取科学的态度和方法，对教育工作中的活动、人员、管理和条件的状态与绩效，进行质和量的价值判断。具体说明四个特点。

4. 列举提高测验信度的主要方法？【答题要点】：基于以下要点展开阐述

列举出提高测验信度的主要方法，并简单解释。 5. 测验的题目主要有哪些类型？【答题要点】：基于以下要点展开阐述

列举出测验的题目主要有哪些类型，并简要解释。（四）论述题

1. 教师评价的方法，如何处理不同评价方法之间的关系。【答题要点】：请参考以下要点展开阐述。教师评价的方法有哪些不同评价方法之间的关系

如何处理

2. 列举评价学生课业发展进步的主要方法，并就其中的一种评价方法进行简单分析？【答题要点】：请参考以下要点展开阐述。评价学生课业发展进步的主要方法就其中的一种评价方法进行简单分析

本文来源：https://www.bwwdw.com/article/epcx.html

相关文章：