心理卫生评定量表概论

更新时间：2024-04-12 20:55:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

心理卫生评定量表概论

第一节心理卫生评估的任务、手段和作用

当代心理卫生工作始于本世纪初，至今已有近百年的历史，其基本宗旨为：“完全从事慈善的、科学的、文艺的、教育的活动，致力于维护世界各国人民的心理健康，增强对精神疾病与心理缺陷的研究、治疗和预防，增进全人类的幸福”（第一届国际心理卫生大会，美国华盛顿，1930）。为了达到这一目的，广大心理卫生工作者作了持续不懈的努力，在各方面都有了长足的进步。其中，心理卫生评估工作者研制了各种系统的评估方法，从生理、心理和社会诸方面了解个体或群体心理卫生状况，为开展心理卫生工作提供了大量的系统性科学依据，使心理卫生临床实践和科学研究更具科学性。

一、心理卫生评估的任务

心理卫生评估对象是人，包括了病人和健康的人，故评估的范围涉及了疾病，又涉及了健康，而且更重视健康的评估。心理卫生强调生物心理社会医学模式，评估的内容必须涉及这三个方面及相互间影响。当然在某项具体临床工作或研究中，常常需要有所侧重，但在分析结果时应全面考虑其他方面的影响。具体而言，心理卫生评估任务包括如下方面：

1．描述个体或人群有关疾病的特征，主要是从疾病的行为表现或精神病理学水平进行评估，协助临床诊断分类，作为科研病人入组标准，寻找各类疾病的特征性表现。

2．描述个体或人群的健康状况，全面地从生理、心理、社会等方面对构成健康的诸要素进行评估，为研究增进各种人群的健康机制和方法提供依据。

3．评估日常健康行为习惯和日常功能有效水平。

4．评估疾病发展中的心理过程，包括认知、行为、社会、情感等诸心理过程。

5．评估心理社会因素在疾病自然愈合过程中的作用。

6．评估个对不同应激刺激的反应，主要指在实验室控制条件下，观察个体对各种应激事件的心身反应性质和程度。

7．评估疾病康复过程中的各种治疗方法的效果及其与心理社会影响因素的相互作用。

8．评估生活方式对防治疾病和增进健康的影响。 9．评估个体或人群的社会经济状况对健康的影响。

10．评估各种生态学有害因素对健康的影响，既包括了象噪音、环境污染、建筑风格等自然环境因素，也包括人际关系、群体气氛、家庭结构和关系、人口流动、城市化等社会环境因素。

11．评估卫生保健的有效性，主要是指各种卫生保健设施和方法对提高人群健康的作用。

12．评估医嘱依从性对疾病和健康的影响。二、心理卫生评估手段

心理卫生评估方法众多，有传统医学检查方法，也有心理测量学技术，还有社会学及其他学科检测手段，多种方法结合使用，收集的

资料更为全面，评估结果更具科学性，从而在心理卫生工作中更有价值。

1．健康史的自我报告

通常采用一些有关既往健康问题的定式报告清单，让受检者自己填写。报告内容主要涉及了心身问题，早年心理发展情况及社会功能情况等。这种方式在对人群中大面积调查较为适用。

2．收集档案记录

对某些特定人群如某一类型疾病患者、某种职业人群、某一特殊个案的医疗、工作及生活中记录进行收集、整理和分析，以便发现与疾病或健康有关联的资料。有些记录可是官方的，发工作档案和司法记录；也有些是民间团体的，如病历、名人传记等；还有些是个人生活记录，如日记等。不管档案是何种来源，公开的或者非公开的，资料收集者都应严格遵守其职业道德，注意保密，保护当事人利益。

3．观察法

包括自然观察和标准情境中观察两种，前者是指在日常生活环境中对受检者行为进行观察，后者则在特殊的实验下观察受检者对特定刺激的反应。自然观察可观察到的行为范围较广，但需要更多的时间与受检者接触，观察者要有深刻的洞悉力；而标准情境中观察是预先精心设计的，按一定程序进行，每个受检者都接受同样的刺激材料，故称之标准观察，观察到的结果具有较高的可比性，从某种意义讲，更具有科学性。虽然实验环境下可观察到的行为范围有限，但个体某些特征如个性特点或适应方式此时表现更为明显，故而更为有效。实

验环境只不过是自然环境的模拟，从这一点看，二者之间并无显著的鸿沟。

4．晤谈法

晤谈（interview）是一种有目的会话，如果按照一定的固定程序进行，则称之定式晤谈（strctured intervciew）。晤谈是心理卫生评估的一种基本技术，其目的是为了面谈者（interviewer）与受谈者（interviewee）之间进行感情思想方面沟通。沟通有言语方面的如听和谈；也有非言语性的，如表情、手势和姿势等。晤谈在不同学科有不同分类，比如精神病学有入院晤谈、诊断晤谈等；临床心理学有评估晤谈和治疗晤谈。这些分工一般都是相对的，并无绝对的区分。在心理卫生评估中，晤谈主要有如下作用：

（1）建立相互合作和信任的关系（rapport）。（2）获得受检查者问题的初步信息。

（3）收集个人的健康史，对受检者的生活以及他的社会关系做出全面的和尽可能详尽的估计，尤其对其心理应激情况做出评价。

（4）对受检者的心理症状和有关精神病理问题进行精确的描述。（5）向受检者介绍有关心理卫生的知识

（6）支持受检者追求改进的信心，并且提供解决心理卫生问题的具体办法。

5．心理测验方法

包括心理测验和评定量表，是心理卫生评估主要的标准经手段之一。这一方法将在以后各节中做详尽介绍。

6．生物医学检查

包括体格检查和各种实验室检测，详见有关医学专著。 7．其他手段

随着人们对心理卫生工作质量要求的提高和现代科学技术的迅速发展，心理卫生评估也开始注意到其他学科一些最新技术，如环境遥控技术、人口流动生态学检测等。

本书为介绍各种心理卫生评定量表之工作手册，较少涉及心理卫生评估其他方法。在心理卫生评估中评定量表固然重要，但其他方法更不能忽视。只有对心理卫生评估方法有一全面了解，多种方法结合使用，综合所有方法收集的信息并结合评估的人群或个体的具体情况，才能对评估对象各个方面做出全方位的分析研究，较好地完成心理卫生评估的任务。

三、心理卫生评估的作用

心理卫生是增进人的健康工作，其服务对象有各种各样的人群（population），也有具体的个人（individual）。对人群的心理卫生状况的了解，是卫生行政管理部门制定提高人群健康计划和防治疾病措施的重要依据。对个体的服务可能是病人（patients），也可能是来访者（clients）。前者是生理上或精神上有障碍，需要治疗；后者只在情绪或适应环境上遇到困惑，需要帮助。在帮助或治疗前，就要全面了解其心身状况。心理卫生评估在这些方面发挥了重要作用。

现代的医学模式已逐步向生物、心理、社会医学模式过渡。生物、心理和社会这三方面因互相互作用、相互依存。世界卫生组织对健康

的定义，包括身体、心理、社会适应能力和道德四个方面，而心理卫生评估内容涉及了这全部的四个方面。

当今的心理卫生工作范围远远超出了传统医学界限，并冠以健康心理学这一新的名称，更加重视人类生活质量、生活方式及各种心理因素在疾病发生和发展中的作用，并涉及了与人类健康有关的所有领域，已经走向各种健康保健单位、学校、工厂、农村等等。在这些领域，心理卫生评估是心理卫生工作不可缺少的部分。

心理卫生评估在不同领域其作用大同小异概括起来有如下三个方面：

1．作决定

通过心理卫生评估，使我们全面了解了某一人群某一个体的心理卫生状况，进而制定心理卫生计划，或者对个体作出诊断，制定治疗方案，向来访者提出忠告或建议等。

2．形成印象

评估的第二个意义是心理卫生工作者形成对来访者或病人的印象，这个有个别化意义，印象正确与否取决于评估时获得的信息。第一印象很重要，因其形成后常很牢固。研究表明，三次晤谈后形成的印象与第三十次晤谈时的相关极高。社会心理学家也指出，第一印象往往有“贴标签”的作用。

3．核实假说

任何科学研究或者临床医学诊断都是不断地修正假说、核实假说过程，心理卫生评估作为其中一种方法而发挥作用。比如冠心病与“A

型个性”的关系就是一很好的例子，早先人们只是通过自然观察或其它一些渠道得来的信息，形成了成功型的管理人员与冠心病具有某种联系的初步假说，通过采用全面的心理卫生评估方法作了大量研究证实“A型个性”与冠心病具有肯定的关系，后来进一步研究表明只是某几种“A型个性”行为特征（如敌意、攻击性等）与冠心病关系密切。

第二心理卫生评定量表的概念一、心理卫生评定量表的性质

心理测量学（Psychometrics）上，评定量表（rating scales）是用来量化观察中所得印象的一种测量工具，为心理卫生评估中收集资料的重要手段之一。

在心理卫生理论研究和临床实践中，常常需要对群体或个体的心理和社会现象进行观察，并对观察结果以数量化方式进行评价和解释。这一过程称为评定（rating）。而评定决非漫无目的，需要按照标准化程序来进行，这样的程序便是量表（scales），例如症状自评量表（SCL-90）、汉密顿焦虑量表（HAMA）、老年认知功能量表（SECF）等等。这些量表之所以标准化，一方面在于量表的内容（项目）只是所研究现象的部分有代表性标准样本，正如对水文、空气和人体血液等进行物理化学分析时的取样研究一样，取部分代表全体；另一方面对所有受评者进行同样的内容评定，按照相同的评定规则进行结果描述，或给邓一具体分数，或划分某一范畴，并进行解释评价。

评定量表是以自然观察为基础的，与自然观察一样，其依据的资

料也是在自然情景下收集的，但却是在真实条件下获得，因此评定量表可以看成是自然观察的延伸。但是，评定不是现场观察的直接记录，而是较长时间的纵向观察印象的综合，包含了解释和评价过程。因此收集的资料更接近实际情况。

从狭义上理解，评定量表不是一种测验（testing），是由他人作出的评价，而不由受测者本人对测验项目作出的反应，这里似乎仅指他评量表。由于他评量表是评定乾对受试者进行主观的评价，在这种意义上又自然数主观量表。实际上，现在对评定量表的理解要广泛得多，在人格测验中应用较多的自陈方式，各种各样的行为问卷、调查表也归类于评定量表，只是这类量表资料主要用来于受评者自己的评价，故称为自陈量表，也叫客观量表。这样，评定量表和测验在性制上越来越接近，二者之间并无绝对划界。如果要对二者作出区别，只是测验方法更接近实验室方法，是用标准的测验手段，在严格的控制条件上，从横断面对受试者行为取样；而评定方法偏向观察、晤谈这样的临床方法，是纵向地作行为取样，因此可以把评定方法看作是观察法与测验法的结合。有些量表如人格自陈量表、心理发展量表等可作为测验，也可当作评定量表，值得一提的是，有些评定量表标准化程度不如测验，其信度、效度也远非测验那样经过了严格的考验。

评定量表不仅在心理卫生评估中广泛应用，在心理学、社会学、医学、教育、工业、商业、行政管理等领域应用历史更为悠久，范围也更为广泛。心理卫生评定量表范围极广，要准确界定是困难的，常用于心理卫生评估的评定量表便成了心理卫生评定量表（Rating

Scales in Mental Health），有些心理学、社会学及精神病学评定量表与心理卫生评估关系密切，心理卫生评定量表自然也包括了这些种类的量表。评定量表的使用，使心理卫生临床工作和理论研究更加快速和简便，研究结信纸更具有科学性。

二、心理卫生评定量表的形式和种类 1．形式

心理卫生评定量表形式有多种多橛，除具有他评量表性质的主观评定量表外，常见的形式还有陈量表（self-report scales）、问卷（questionnaire）、调查表（inventories）和检核表（checklists）等，这类量表均有评定量表的性质，但其内容、结构及功用稍有不同。

（1）评定量表（主观量表）过去在心理学和教育学使用较多，其特点是结构明确，量表各项目描述精细，通过知情人对受评者心理特点、行为等项目根据其观察印象逐项判断，不仅要判断每一项目被评定乾是否出现，而且要按照量表项目程度等级标准作出程度估计。虽然评定者的评价是主观的，但评定依据来源却是客观的，故具有相当的真实性。

（2）自陈量表较早用于人格测量，后来发展起来的用于调查个体情感、兴趣及行为的各种问卷、调查表均属同一性质，总称为自评量表（self-rating scales）。此类量表均是让受评者自己按照量表内容要求提供关于自己心理（内隐行为）、行为及个人社会经济北景材料的报告，量表内容通常为一系列陈述句或问题，每个句子或问题描述一种行为特征或现象，要求受试者作出是否符合自己情况的回答。量

表的项目以“是”或“否”回答方式最常见。也有折衷是非式（是、否、不一定）、二择一式、多项数字选择式、文字量表式等方式。自陈量表主要特点为其项目数量多，项目描述清晰，内容较全面，了解的信息量大，而且可以团体实施。但受评者报告自己行为时常常会带有某些偏向。

（3）检核表常作为了解个体行为特征，尤其是异常行为的调查工具。在性质上通常属于他评量表，也有少数属自评量表。量表项目具体，通常包含一系列待业描述语句；量表操作简便，评定者仅只需确定各行为项目是否在受评者身上出现即可。

2．种类

心理卫生评定量表分类可按量表项目编排方式，也可按评定者性质进行，而最常见的为按量表内容进行分类。此外，还有按量表功能分类特征描述性量表和诊断性量表，由于心理卫生评定量表主要是对心理健康状态各个侧面作出评定，故前者居多，后者虽有包括，但使用范围有限。即使是诊断性量表，也主要是指“心理特点诊断”，如对受评乾人格结构、尚保存的和受损的能力或心理功能加以评估，而不是临床医学的疾病诊断。

（1）按量表项目编排方式可以分为以下5种：

①数字评定量表：提供一个定义好的数字序列，由评定者给受评者的行为确定一个数值（等级）。例如：症状自评量表（SCL-90）就是由受评者自己对每项症状陈述作出从无至极重的程度选择，其数字序列为0~4五个数字序列。

②描述评定量表：对所要评定的行为提供一组有顺序性的文字描述，由评定者选出一个适合受评者的描述。也可将描述量表与数字量表综合起来。给每个描述一个等级。这种方法简单易懂，较为常用。例如：儿童适应行为评定量表评定儿童穿衣技能时，由评定者根据知情者对受评儿童观察情况，在下列定义的六级数字序列中选择一个：

自己能穿各种季节衣服 5 稍加提醒，自己能穿各种季节衣服 4 在提醒下自己能穿夏天衣服 3 在帮助下东拉西扯地穿衣服 2 被穿衣服时能伸手脚给予配合 1 完全靠别人穿衣服 0

③标准评定量表：呈现一组评定标准让评定者判断受评者，例如对住院病出院时疗效判断，就是根据痊愈、近愈、好转、无效、恶化的工作用标准而选择其一种情况。

④检选量表：提供一个由许多形容词、名词或陈述句构成一览表，评定者将表中所列被评者的行为逐一对照，将适合受评者待业特征的项目挑选出来，最后对结果加以分析。此类量表常用于人格自陈量表效度检验。

⑤强迫选择评定表量：评定者在各项目中强迫选择一种与受评者状况最接近的情况。例如：要求中学老师使用强迫选择方法来判断其学生在校行为，在下面五个陈述中只能选择一个。

对该学生最好的描述是：

友善合作有领导才能学习努力踏实能力（2）按评定者性质可分为自评量表和他评量表。

①自评量表：量表的填表人为受评者自己，受评者对照量表的各项目陈述选择符合自己情况的答案并作出程度判断。量表实施方便，可作为团体测评，但要求受评者有一定的阅读和理解能力。

②他评量表：量表填表人为评定者，一般由专业人员担任，如心理评估工作者、医师或才护士等。评估者即可根据自己的观察，也可询问知情者意见，或者综合这两方面情况对受评者加以评定。评定者要具有与所使用量表内容有关的专业知识，并且需要接受严格的训练。

（3）按量表内容分类，心理卫生评定量表种类颇多，本书介绍了十一大类评定量表，尽管不能包括全部，但常用的均有所涉及。

①心理卫生综合评定量表。 ②生活质量和幸福度评定量表。 ③家庭功能与家庭关系评定量表。 ④人际关系与人际态度评定量表。 ⑤抑郁评定量表。 ⑥焦虑评定量表。 ⑦孤独评定量表。 ⑧自尊与自信评定量表。 ⑨心理控制源评定。 ⑩烟草与酒精依赖的评定。

⑾应答偏差的测评。

除上述这些分类方式外，还有其它多种形式，如按记分方式划分等，这些划分不是绝对的，某一量表可能划入多种类别中。

三、心理卫生评定量表发展简史及其价值 1．评定量表发展简史

评定量表是从心理计量学中衍生出来的，追溯评定量表发展的历程，要找出第一个使用评定量表的研究是相当困难的。十九世纪末，克雷丕林（Kraepelin，1892）的自由联想测验（free association test）据认为人格量表的先躯（Anastasi,1988）。该测验为检查者对受检者呈现一些特殊选择的刺激词，记录受检者对该词在脑中联想互的第一词，当时采用这种技术研究疲劳、饮饿及药物的心理学影响，也有些早期研究表明该技术能区分不同种类的精神障碍。另有一些早期学者如高尔顿（Galton）、皮尔逊（Pearson）及卡特尔（Cattell）等在发展标准经问卷与评定量表技术方面作了大量工作。这些先躯性工作为当代评定量表的发展提供了坚实的基础。

在第一次世界大战时，武德沃斯（Woodworth）编制的“个人资料单”（Personal Data Sheet ）算是当代最早的与心理卫生有关的评定量表。该量表设计为自陈量表形式，量表列举了一些与精神病有关的症大辩论，如“你常作白日梦吗？”“你尿床吗？”等，用于考察士兵对军队生活的适应情况，并甄别不宜服役的精神病人。尽管该量表在战争结束时尚未完成，未能投入正式使用；但战后却发展为多种用于平民的版本，并成为当代各种客观评定量表的雏型。以后各种情绪

适应调查表（emotional adjuistmentinventorise）相断涌现，并朝向专一化发展，如专用于家庭适应、学校适应、职业适应等。另有一些量表是专门评定人际关系。兴趣（interests）和态度（attitudes）评定量表在客观评定量表家族中发展最晚，但近年来发展非常迅速。

三十年代初，随着行为评估的兴起，主观的评定量表开始受到重视。与观客的自陈量表不同，这些量表着重评定可观察的行为（外显待业）和日常生活中各种情景下的行为表现，如儿童的欺骗、说谎、偷窃、合作性、持久性等。这方面Hoggerty Olson和Wichman于1930年出版的“待业评定量表”被认为是最早的（Wrigh,1960）。

二次世界大战后，临床心理学和精神病学得到迅速发展，对心理评估工具有更大的要求，大量的精神病理学及异常行为评定量表相断出现，如焦虑量表、抑郁量表、精神病症状量表等。这些量表极大的丰富了后来的心理卫生评估手段。事实上，这一时期的心理卫生评估工作与这些专业是未加区分的。

进入七十年代，评定量表经过了半个多世纪的发展，编制方法不断完善，种类迅速增加，在各个领域应用之广，已超过了心理测验，这标志着评定量表已开始进入成熟期。同时，心理卫生评估也开始具有富于自己特色的手段，例如评定“A型人格”的“詹金斯活动调查表”（Jenkins Activity Surey），Holmes等编制的评定生活事件的“社会重新适应评定量表”等，就是这一时期产物。大量评定影响人类健康的心理社会因素的量表也开始相断出现。

目前，评定量表已在心理卫生科学研究和临床实践中发挥了重要

作用，并将在心理卫生评估工作中断续占有重要地位。在欧美，基本上很少发表不应用评定量表的研究性论文。我们近年来已引进国外很多常用量表，有些进行了修订；同时也编制了一些我国自己的评定量表，为我国心理卫生研究提供了一批可靠工具。同时，应该看到我国这方面工作起步较晚，与一国外发达国家还有一定差距，无论是在量表的种类和数量、还是在量表应用质量上还有待进一步的提高。本书介绍了国内外心理卫生评估中常用的评定量表，希望对提高我国心理卫生评估工作者的量表编制和使用起到推动作用。可以相信，在下个世纪，我国的心理卫生评估工作者定能编制、修配订和使用大量的反映我国社会文化背景的评定量表，对我国的心理卫生评估事业做出更大的贡献。

2．评定量表在心理卫生评估中的价值

评定量表之所以广泛使用，主要在于其如下价值：

（1）客观一般每个评定量表都是一定的客观标准，不论是何人、在何时、何条件下来评定受评者，均应根据这个标准来收集资料，作出等级评定，因此所得结果比较客观。即使就他评量表而言，尽管评定者作出的评价是主观的，但其依据来源是真实的，从这种意义上讲，同样具有相当的客观性。

（2）数量化对影响人们健康的心理和社会因素描述，如果没有一定的数量，而只有文字描述，那么在不同地点、不同时间、不同的结果便难以比较。评定量表使观察结果数量化用数字语言代替文字描述，是研究样本较理想的入组指标和研究因素的变量形式，有助于

分类研究，便于交观察结果作统计学处理，更有利于计算机分析，研究的结果表达更符合科学要求。

（3）全面评定量表的内容全面而系统，等级清楚。用它来观察受评者，收集个体一般资料，评价心理卫生各个方面，估计防治效果，一般不会遗漏重要内容。其功能相当于一份详尽的观察和晤谈大纲，并能协助评定者发现其他评估方法如观察、晤谈等所遗漏的内容，并弥补如心理测验等方法的不足之处。此外，评定量表适用范围几乎涉及心理卫生状况的所有侧面，各种心理卫生调查和各种研究心理和社会因素对人类健康的课题均可应用。

（4）经济方便评定量表能够广泛运用，一个重要原因在于各类人员较易学会操作方法，且无需象心理测验那样的特殊器材和条件，完成每一份量表评定通常只需10至30分钟，省时、省力、省钱。评定者和受评者一般都乐意接受。

第三节评定量表的编制与标准化评定量表的特征一、评定量表的主要编制方法

评定量表的编制方法因量表的种类和编制者的不同而有所差异。按心理测量学原理，主要有下面四种方式：

1．推理法

早期的评定量表编制者，尤其是早期人格自陈量表的编制者，常用此方法，编制此类量表时，首先要确定所评的内容（某种心理特质或行为）和理论依据，但量表的项目却是出自编制者个人的经验推论。量表的项目表面上反映了所评定的内容，实际上可能并不一定测量这

些内容，即量表的表面效度并不能保证其真正效度。

2．实证法

推理法依赖内容效度，而实证法却依据实证效度，即以量表项目与校标间的关系来编写项目。实证法编制量表一般分三个步骤，第一步是挑选一个由具有所评定特质或特征的人组成的校标组以及普通人组成的对照组。例如，我们要评定癌症病人的行为特征，显然癌症病人就是校标组，而对照组则可为良性肿瘤病人。第二要确定哪些行为特征可以区分癌症病人和良性肿瘤病人，可以通过以下途径获取这方面资料：①查阅有关文献及病历档案等；②对癌症病人行为进行研究分析；③请有经验者列出一些能够反映癌症病人行为特征的陈述语；④参考其他测验或评定癌症病人的量表。根据这方面的材料，就可以编写和选择量表项目。第三步是将编好的项目施评于校标组和对照组，将能区分两组人群的项目保留，这些保留下来的项目组合即成为量表。采用实证法编制的量表有较好的实证效度，如果只评定特定的校标人群，结果是合理的，但如用于与校标人群稍微不同的个体，如不同性质癌症或不同病期癌症病人，其结果解释则有其局限性，即结果解释受原始校标的影响。

3．同质法

所谓同质就是指量表具有较高的一致性，更具体地讲，就是同一量表的所有项目之间最有较高的相关。采用同质法编制量表就是要把量表中没有相关的项目删除，以保证量表各不相同的项目都能测量相同的品质（以心理现象为例，如心理特质或行为特征等）。同质量表

的编制按下列步骤进行：

（1）对标准样本某一人群施评大量的项目。

（2）采用因素分析或其他相关分析，把项目归为若干同质性类别，将与各类别相关很低的项目，或者各类别都有较高相关的项目删除。

（3）对各类项目的内容进行分析、重新排列、并命名、便得到若干个不同质量表（分量表或因子），这些同质量表合起来就是一个完整的评定量表。

同质法编制的量表虽有较好的结构效度，但有时难以保证实证效度。

4．综合法

事实上，现在评定量表编制者大都不是采用某一种方法，而是多种方法的综合。常常采用推理法编制大批项目，用实证法和同质法对这些项目进行筛选和编排。如果表的目的主要用于预测或作实际决定，项目的筛选则重实证法；如果主要用于理论研究，则偏重同质法。这样编制出来的量表既具有理论依据又有实用价值。

具体编制一个评定量表时，不管采用哪种方法，都需大量的心理统计技术，这里暂不作介绍，请读者参阅有关心理测量专著。

二、标准化评定量表的特征

一个评定量表采用上述的编制方法完成后，只是完成了部分工作，即量表的行为样本标准化工作。这样的量表还需进行一系列标准化过程，量表的编制才算正式完成。编制后的量表能否投入使用，其

品质如何可，主要根据其标准化特征和程度来衡量。

1．取样（sampling）

心理卫生评定量表就是对所观察的个体心理卫生各个侧面（心理的、社会的、环境的因素）进行评价，评价则需一定的标准（或称标尺），这个标准产生于样本。按传统的测验学理论，对测验或评定的解释是以被测或被评者的所属群体为标准，但在编制测验或量表时无法测量这个群体中所有成员，使只能取样，即以样本代表体。样本必须有代表性，否则这个测量或量表的信度和效度便不高，结果解释不准，可见取样代表性的意义。如何提高取样的代表性，不仅是要有足够的样本量，同时要能反映能影响所测或所评的品质（以心理为例，如智力、人格、行为等）的所有有关变量（按前例，有年龄、性别、民族、生活地区等等）。

取样方法分多种，如随机、整理和分层比例取样等。不管用何方式，都要使样本有足够代表性。应根据群体各变量的分布特点来决定取样方式，若诸变量在群体中分布均匀，随机样本有代表性；在群体中若某一整群所含诸变量能代表全体，则比整卫生员可做样本；上述变量分布均匀和某一整群有足够的代表性一般不多得，那么按分层比例取样是可取的。以取样人群代表全体，再按全体中各变量的人数比例来分配各层人数。

因此，在选择测量工具时必须注意编制此工具的样本代表性和所要评估的对象情况是否在样本内。受评者的情况在这些方面与标准样本相应，所测结果与标准样本才有可比性。在临床上，某些评定量表，

项目数少，功能单一，仅用于某些特殊人群，或者是自身前后对照研究，虽无标准化样本，但仍具实用性，只不过是使用范围限局限而已。

2．常模（norm）

常模是一种供比较的标准量数，由标准化样本测试结果计算而来，其形式大致有如下几种：

（1）均数是常模的普通形式，一般临床量表大都采用这种形式。某一受评者所得成绩（粗分，或称原原始分）与标准经样本的平均数相比较时，才能确定其成绩的高低。

（2）标准分均数所说明的问题还是有限的。只看均数，不注意分散情况，所得受评者的信息非常有限。如用标准发作常模，便可提供更多的信息。标准分能说明受试者的评分成绩在标准化样本的成绩分布图上居何位置。标准分（Z）=受试者成绩（X）之差（即X-X）除以样本成绩标准差（SD）。简化成Z=（X-X）/SD。这样一来，不仅说明受评者的成绩与样本比较在其上或在其下，而且还说明相差几个标准差。

许多评定量表采用这种常模或由此衍化出来的其他形式，离差智商就是一种。其计算公式为：离差智商=100+15（X-X）/SD。尽管是韦氏智力量表最采用此形式，但后来有些评定量表结果表达也采用机同形式，只不过意义不同。例如：美国的Vineland适应行为量表的知应行为总分（adaptive behavior composite）和我国的儿童适应行为评定量表的适应能力商数（ADQ）就是采用离差智商这种形式。此处与标准发不同之处在于：①前者均数为100，而后者数为0，X-X时

在离差智商为100，在标准分为0；②此处的离差乔商规定标准差为15。

T分也是标准分衍化来的一种形式，在评定量表中较常采用，例如MMPI便采用此种常模。T分计算公式：T=50+10（X-X）/SD。

由标准分衍化而来的其他形式还有标准20、标准10及标准9，都是通过改变幸免数及标准差值而得。

（3）百分位（Percentile rank, PR）这是另一类常用常模，比标准分应用得早，且更通用。它的优点是不需要统计学的概念便可理解。习惯上将成绩差的排列在下，好的在上，计算出样本分数的各百分位范围。将受试者的成绩与常模相比较，如相当百分位50（P50），说明此受试者的成绩相当标准经样本的第50位，也就是说，样本中有50%的人数，其成绩在他之下，另有50%人数的成绩比他要好。又如在P25，说明样本中25%的成绩在他之下（或至多或他一样），另爱75%人数的成绩比他要好。以此类推。

（4）划界分（cut-off score）

在评定量表中，特别某些用于特殊人群的临床量表，由于其样本常常不是正态分布，不具备制定标准分常模的条件，而多采用划界分常模。筛查用量表中也常此种常模。划界分是指用一具体量数，对评定结果进行划界。如“流调用抑郁量表”（CES-D）采用划界分标准为：总分≤分为无抑郁症状，16~19分为可能有抑胡症状，≥20分肯定是有抑郁症状。如果某量表对所测查的疾病很敏感，就说明设立的划界分很有效。病人被划入假阴性的人数就很少甚至没有，正常人被

划为假阳性的也很少或没有。如果不敏感，侧假阳性或阶层阴性的机会均会增加。

除上述常模形式外，还有其他性质的常模，例如年龄常模（按年龄分组建立，在儿童和老年人量表常用）、区域常模和各种疾病诊断常模，等等。从可比性看，常模越特异越有效；从适应性讲，则以通用常模使用方便。

3．信度（reliability）

信度是指测验或量表的可靠性和稳定性的程度，用信度系数（coefficient）来表示，一般说，系数越大，说明一致性高，测得的分数可靠；反之则相反。不同种类的评定量表其信度要求有所不同，一般客观的自陈量表要求较高，而评定异常行为的主观评定量表一般都不太高。信度的高低也与所采用的信度检验方法有关。信度可以从不同方面来说明量表功能和稳定性、不同时间的稳定性、不同评定者的结果稳定性，等等。它们的相应检验方法为：

（1）重测信度（test-retest reliabilty）是一组受评者在两次不同时交易会和同一套量表评定，对两次结果作相关性检验，以估计量表结果的稳定性。

（2）分半信度（split-half reliability）将一套量表的各项目按奇、偶数号分成两半，对其评定结果进行相关性检验。由于分半信度检验量好要求量表项目按难度排列，而大多数评定量表均非如此，故其使用有限。

（3）同质性信度（inter-item consistency）所谓同质性信度是指

评宣表内部所有项目间的一致性，这里讲的是分数的一致，崦不是项目内容或形式的一致。量表内各项目分数相关越高，则量表项目就越同质。最常用的检验同质性信度方法为库德一理查逊公式（Kuder Richardson formula20,K-R20），但K-R20公式只适用于二分法计分题量表，而对多重记发法量表则常用克伦马赫α系数（Cronbach’ s S α Coefficicient）估计。另外，分半相关法也是估计同质性信度的一种方法。

（4）评定者信度（inter-rater reliability）数名不同评定者采用同一套量表对相同受评者进行评定，对所得结果进行一致性检验，以估计评定量表评分客观性。对心理测验而言，一般都采用客观性项目，且有一套相当标准化的评分程序，因此由评分引起的误差变异是可以忽略的。而评定量表相当多的是主观项目，且评定者在评分时或多或少掺杂主观判断成分，故评定者之间的评分误差变异难以避免。一般要求在成对的受过训练的评定者之间平均相关系达0.9以上，才诊断评分明客观的。

其它尚有正复本相关、因素信度、测量标准误等信度检验方法，此处从略。

4．效度（validity）

所谓效度即有效性，指一个测量工具能够测出其所要测量的东西的程度。这包括两个意思：一是测查了什么特性，二是测查到何种程度。如一个抑郁评定量表，诺评定结果所表明确是受评者的抑郁特性，而且评准了抑郁的严重程度，那么这一抑郁量表的效度就好；反之则

不好。评定量表的效度检验方法与心理测验一样，分为三类，即内容效度（Content-related Validation）、实证效度（Criterion-related validatio）和结构产度（Construct-related validation）。

（1）内容效度指量表项目反映所测量内容的程度。如生活事年评定量表应反映受评者各种日常情景下的精神应激的程度。内容效度通常无理想评估指标，主要通过专家对量表内容的评价和编制量表时严格按预定的定义、行为取样的范畴进行目筛选来保证。

（2）实证效度也称校标效度，是指一个量表对处于特定情境中的个体的行为进行预测的有效性，也就是对于我们所感兴趣的行为能够预测的程度。例如，用人格自陈量表预测哪种人易患精神疾病。检验实证效度一般是将量表评定结果与某一标准行为（即校标）进行相关检查。如抑郁量表与抑郁症病人的临床典型症状、诊断性量表与临床诊断进行相关分析均属之。如果二者相关程度（或一致性程度）高，则说明实证效度理想；反之则相反。评定量表在心理卫生评估中常常是作为预测个体或群体的健康状态。或者确定影响健康的各种因素，因此这类量表实证效度意义要大于结构效度。

（3）结构效度反映编制的量表所依据理论的程度。如编制一个心理防御机制量表，必定依据有关的心理防循机制理论。同时，所编制的量表是否符合原来预计的理论框架，也可用结构效度来检验。

量表的效度研究，不管是在量表编制过程中，还是编制之后都要持续地进行，并且是一项长期的、永无止境的工作。量表的效度材料越丰富，对量表的功能认识就越全面。

5．方法的标准化

评定量表必须按一定的规则实施，其记分方法和方式、分级的标准、结果的换算也要按一定的规定进行，只有这样，评定结果才具有较高的真实性。因此方法是否标准，也评定量表中具有重要意义，这些方法在后面内容中将详细说明。

上述的评定量表标准化特征，并不是每个量表都要象标准经测验那样应全部具备，有的量表可能多一些，标准化程度要高一些，如标准的客观人格自陈量表；有的可能少些，标准化程度就不那么好，但有一定的标准化比没有要好，其得到的结果也可靠些。至于每个具体量表做了哪些标准化工作，如常模样本、施测方法、信度和信度资料，都应尽可能详细地在量表使用手册上说明。

三、评定量表的基本内容

每个具体的评定量表编制后，经过一定的标准化过程，便算完成，不同种类和功能量表。具体内容相差甚远。但从总体而言，包括的基本内容大致相同。

1．评定量表的名称

量表的名称可以仅指量表的各类，如紧张性生活事件评定量表（SLERS）、症状自评量表（SCL-90）；也可以是既表明种类又包括量表的编制者或编制的单位（或单位所在地名），如汉密顿抑郁量表（HAMD）、流行病学研究中心抑郁量表（CES-D）、康奈尔健康量表（CMI）等。在研究或临床报告中，首先要写明所使用的量表名称。

2．评定量表的项目内容

评定量表由若干项目组成，每一个项目或是一种行为或现象的简单名词，或是描述一种心理特质、行为、症状、现象的陈述句。关于项目的编制原则，前面已有详述，但在心理卫生评估中使用的评定量表，其项目内容还应具备以下要求：

（1）项目描述应尽量简明，用语准确精练；每一个用词描述一个特别意思，避免使用另外词语表在相同意思；要尽可能少用一般性词语，“平均”、“很好”或“很差”等。

（2）项目的内容，应该能反映所评定内容的特征，但也要有一些非特征的内容，尤其是像评定症状的这类量表，既要包括特异性症状项目，又要有些非特异性症状项目。如果某一量表，其项目只涉及了非常特异但十分罕见的症状，那么便不能很好地评定多数病人的病情。

3．评定量表的项目定义

大多数评定量表的项目都有一定的定义。对于自评量表，一般项目陈述并不对所要评定的特质、症状或现象作业格的界定，而由受评者自己理解；而他评量表则不同。最好应有比较严禁格的定义，不然评定者对项目的理解容易混淆。例如汉密顿焦虑量表（HAMA）将第一个项目“紧张”定义为紧张感、易疲倦、易哭、颤抖、坐立不安、能放松；而简明精神病评定量表（BPRS）的第六个项目“紧张”却是指紧张的运动表现，不包括紧张的主观体验。

4．项目分极数量

有些评定量表项目采用二分法分级（即“是”、“否”回答项目），

而大多数心理卫生评定量表的项目为多级评分。如果分极太少，量表的敏感性便降低；分极太多，则分极标准不易掌握，影响评定者之间的一致性。研究表明只有受过严格训练的人才能区别十一个等级，大多数人对七级以上就不能作有效的区分了。通常等级划分在三至七级之间，能五级最为常见。

5．评定量表的项目评分标准

评定标准一般有两种，即项目内容出现的频度和其严重程度，或者是二者结合。一般自评量表的评分标准在量表的前面有一简短的指导语说明；他评量表一般对每个项目评分标准都有特殊规定。“工作用评定标准”较为准确，便于掌握。如HAMD的第四项“入睡困难”，1分：主诉有时有人睡困难，即上应酬后半小时仍不能入睡；2分：主诉每晚均有人入睡困难。“非工作用标准”是根据与所评定人群的一般情况对受评者程度作一判断评分，如HAMA评定各项目标准采用：0分：无；1分：轻度：2分：中度；3分：重度；4分：严重。“非工作用标准”要求评定者有一定的实际专业工作经验。

第四节心理卫生评定量表的选择和评价方法

一般而言，作为量表的使用者，首先根据自己的研究目的来选择。例如；研究某种人群的抑郁特质情况，显然会选择与抑郁有关的量表；为了使评定结果具有更好的客观性和真实性，显然选择标准经程度较高的量表；大多数临床工作乾在具体临床实践中，仅仅只是对工作对象作大致的了解，形成初步印象，故多选择实施简便，省时经济的量表；为了实用与类比，往往选择常用的量表。然而，现在常用量表很

多，每类少则几种，多则数十种，具体选用哪种量表，还需要用其他方法对其进行比较和评价，Riezen HV和Segal M（1988）提出一整套评价量表的原则。

1．量表的功效（resolution）

所谓量表的功效指所使用的量表能否全面、清晰地反映所要评定的内容特征，真实性又如何？这与量表本身内容结构有关。有的量表可评定多个方面特质，而另一些量表则只限评定一致两种特质，前者量表项目覆盖面大，但有时难深入，且看来评定者差异上后者要小于前者。有的量表适用于所有年龄和各种类型的人群，而另一些量表可能只限于某一年龄阶段或某一特殊人群，如某一种疾病患者。质量好的量表应该项目描述清晰，等级划分合理，定义明确，以反映出行为的细微变化。出现的频度或严重程度分极最好采用3至7级划分。量表应尽可能简短，又不损失必要的细节。

1．量表的功效（resolution） 2、敏感性（sensitivity） 3．简便性（simplicity） 4．可分析性（analysis）

指选择的量表应该对所评定的内容敏感，即能测出受评者某特质、行为或程度上的有意义的变化。这与临床上常用的诊断敏感性（特异性为其对应的名词）不同、尽管性质相似，但意义要广泛。量表的敏感性既理发师表的项目数量和结果表达形式（如因子分）有关，

双受量表的标准经程度和信度高低影响。此外，评定者的经济和使用量表的动机也影响了量表的敏感性。

3．简便性（simplicity）

指所选择的量表简明、省时和方便实施。作为量表使用者，大都希望自己采用的量表简短而又功能齐全，省时而又无需特殊训练，结果又可靠；不用特别标准评定方法而标准化程度又符合要求。实际上，量表简短、省时就难全面；使用者不加训练和采用非标准化方法就会降低量表的信度，影响结果的可靠信。使用者应根据自己研究需要采用不同量表，比如用简短量表进行筛查，然后再使用项目多，功能较齐全的量表进行特征性分类研究或病情诊断。几个量表同时配合使用，能弥补单一量表这方面的缺点。

4．可分析性（analysis）

使用量表的目的就是要对评定对象的特质、行为或现象作质与量的估计，这就需要分析比较。一般而言，量表应有其比较标准，或者是常模，或者是描述性标准。分析方式有手工分析和计算机分析。手工分析应简便，不做复杂计算；计算机分析则另当别论。量表中单项分、因子分及总分都是常用分析指标，总分常反映受评者总的情况和变化，在诊断性量表的评定结果分析上其意义显而意见。而大多数心理卫生评定量表为非诊断性量表，其总分意义则相对次之，因其难以反映受评者心理健康的各个方面的变化，而单项分、因子分则是分析这些方面变化的主要指标，把单项分或因子分画成曲线或构成廓图，受评者的某方面心理特质、行为特征或社会背景情况特点更为直观、

清晰。

下面这两个表就是采用这一套评价原则对国外常用的抑郁和焦虑量表定量性评价的例子。

说明：①功效评分为量表的项目定义描述、项目覆盖面、项目间平衡性、项目分级水平数及分级标准、诊断支持及评定方式情况的评分之综合；②敏感性评分为量表项目数、项目水平数、项目组合、标准化定义、信度和所需经验情况的评分之综合；③简便性评分为评定所需时间、所需训练、评定指导语、分级标准、量表复杂性和可接受性情况的评分之结合；④评价总分为前3项评分之和；⑤评价等级按评价总分大小顺序排列。下表相同。

第五节评定量表的实施过程及注意事项

一、实施过程1．准备阶段2．量表的填表过程（1）自评量表（2）他评量表，3．结果换算4．评定结果的解释和报告

评定量表具体的实施应按其使用手册规定的步骤严格进行。概括起来评定量表的实施有准备阶段、量表的填定、评定结果换算及结果解释报告这四个步骤。

1．准备阶段

在采用量表对某一人群实施评定之前，通常需要对评定者进行系统训练，选择适合的评定工具及评定场地的准备。

评定者的训练就是组织量表的使用者（也称评定同）对有所使用的量表理论基础、量表的内容进行全面地学习，并就量表的具体操作方法和结果解释进行反复练习，以达到熟练掌握所使用的量表评定方法，并能较准确地分析解释评定结果的目的。一般经过一定的训练后，正式使用量表前最好要求预试，进行一致性检验，一致性检验符合要示者才能正式成为合格的评定者（一致性检验方法见后面内容）。训练方式有两种，一种为集中训练，这种方式受训者人数较多（一般每个组最好为5~10人），虽较经济，但受训者易相互干扰；另一种为个别指导，即一对一训练，虽效果较好，但不经济。因此二种方式相互结合最为理想。

评定工具的准备就是要选择适合评定对象情况的评定量表，具体选择方法在本章第四节已有详述。量表选择正确与否，直接影响了评定的质量。评定量表一般均为纸笔形式，即一些表格和填表用笔，但少量他评量表有时还要求准备一些评定用道具，尤其是评定儿童时，有时需要一些辅助器材如玩具等，以备评定行为能力或特征性反应之用。

评定通常无需特别的场地，一般在一安静的房间进行即可。有些特殊人群（如住院病人等）的评定量表尚需到受评者经常活动的地方（如病房）地行评定，以使评定结果更加准确。

2．量表的填表过程

评定量表填表过程中，首先应填写受评者的一般背景资料，如姓名、年龄、性别、职业、通讯处等；如果是临床用量表，尤其要注明

病种，有的还要求对受评者申请评定的理由及健康或疾病史作一简要描述。量表的各项目记录或填写方法，处太平量表与他评量表不同。

（1）自评量表各项目填写前应有一简短指导语，说明评定主要目的、评定内容的范围、评定的时间界定（如评定一周内出现的现象，还是一年内出现的现象）、频度或程度标准、以及记录方法与其它要求等，这一指导语虽用文字写明，但评定者最好口头加以说明。量表的项目由受评者自己填写，独立完成填表过程。如果受评者文化程度低，对一引起项目不一解，评定者可逐项念题，并以中性态度把项目本身意思告诉受评者。此外，自评量表常作团体评定工具，受评者人数不应太多，以10~20人为宜。人数太多，受评者之间相互干扰，不易管理。

（2）他评量表，评定者一般都为专业工作者。评定的依据来源，大多数通过知情者提供。所谓知情者是指了解受评日常生活及学习、工作情况的人，一般为受评者父母、兄弟姊妹等亲属；或是在生活和健康方面给予长期照顾的人，如福利院的工作人员等；或是了争情况的邻里、同事、老师等。这种通过知情提供资料的评定方法亦称间接评定法。有些量表，尤其是临床用量表，常常是通过评定者自己的观察印象直接记录量表各项目的评分，这类评定者常常对受评者进行过较系统地观察，如病房医师、与受评者接触密切的心理学工作者等，这种评定法称直接评定方法。不管是直接评定或间接评定，评定者最好应与受评者现场见面，并有所晤谈，以取得某些项目评定的准确证据，或判断资料来源的可靠性。最后，评定者对各来源的依据材料，

对照评分标准进行评分。

3．结果换算

量表各项目评分需要累加为因子分（或分量表分）和总分，这些分数均为原始分，很多量表要求作进一步转换成各种形式的标准分或百分位，或者作加权处理，一般而言，转换分更有比较意义。有些量表使用手册上提供了各种转算表，使用者只需查表即可。

4．评定结果的解释和报告

为了达到评定量表的使用目的，需要对各种评定结果进行分析综合，提出结论，并对其意义进行解释。量表的种类、功能不同和评定的原因不同，其解释的浓度而异。一般而言，如果只打算了解受评者某方面总的状况，总分即可，以郑延平等（1988）编制的紧张性生活事件评定量表（SLERS）为例，如果总分T分（划界分）大于70，则认为受评者总的心理紧张程度高，发生心身障碍可能性很大，如果还想了解某方面内部成份特征，则需在因子分（分量表分）水平甚至项目分水平进行分析。仍以SLERS为例，SLERS包括了学习问题、婚姻恋爱问题、健康问题、家庭问题、工作、经济问题、人际关系问题、环境问题、法律问题这八个因子，只要对这些因子T分进行分析，便可了解受评者心理紧张源主要来自那一方面或其分布特征如何。

将评定主要结构、结论及解释用文字或口头形式表达即报告。对某一人群的评定结果报告类似于一科研调查报告，比较复杂，需要进行大量的统计学处理，如果这类报告可靠，则对心理卫生工作有指导意义；地个体评不定期结果的报告，用语要精确明了，解释合理，才

有科学性。一般提交报告的对象多为专业人员，报告中应采用专业术语，如均数、标准分、百分位等，结论和解释要适度，因为任何评估方法都有一定局限性，结果有程度不一的误差（详见后面内容），故不能绝对化。有时受评者个人或者亲属（评定者认为有必要告知）需要了解评定结果，则多以口头形式报告，一般把专业性术语用较通俗化用语表达，但要注意其科学性。

二、评定结果的常见误差 1．参照标准不统一 2．信息来源问题

3．“光环”效应（halo effect） 4．集中趋势（central tendancy） 5．严格和宽容倾向

6．期待效应（Expectancy effects）又称Rosenthal效应，

一般认为评定量表较饭店理测验容易掌握，其实不然，如果对评定使用不当，或者表本身编制不合理，则评定的结果误差要较心理测验大得多，从而使量表效用大大降低。由证定量表本身所致的误差，评定时较难避免，如果误差过大，只有选用其它性质相似但质量较好的量表。这里仅就与评定者使用有关的误差及其来源进行介绍。

1．参照标准不统一

不同的评定者，限于自己专业知识角度，对一些专业名词有不同

理解，或一些术语本身概念就不统一，以自己熟悉的概率为参照，以致使评定结果不一致。俗云：“仁者见仁，智者见智”，就是这个道理。有担表没有客观的标准或乾只有一些简单的词语描述。此时，评定者对这些描述语的理解标准不一，或者在评定一现象时常以评定者自己作标准，于是不同评定者得出不同结果，例如，在观察某一现象出现的频度时，常用“经常”，“时常”，“偶然”和“从未”等一些时间副词。如果量表对它们未作严格界定，不同评定者的理解很可能不同，所以评分结果不一。由于评定者本身的性格特点、个人价值或主观愿望，以自己为参照标准，评定也往往缺乏客观性。例如：在评定情绪状态时，观察者本人如带有抑郁心境受观察者。如果相反，评定者是带兴奋心境，则将高估抑郁。同样，在能力的评定上，其结果也往往与评定者自己的能力高低而异。高者见低，低者见高。有的受评者为了迎合评定者，所填答的自评量表结果也往往不真实。

2．信息来源问题

评定乾可能对受评者缺乏足够的了解，对某些症状或行为不能作出如实判断，从而高估或低估了受评者。他评量表有时代用直接评定法，要评定的现象不一定在当时便出现，甚至某些心理的或生理的病理特片也不一定经常见到。采用间接评定法，由知情者提供信息，例如由儿童父母和老师、成人的配偶和上级提供评定材料，其出入往往很大。即使不是由于他们与受评者接触不亲近的原因，而由于他们的偏见或观察能力问题，也足够引起结果偏差。有临床经验的人，常见到父母高估低能儿女的智力水平。一些老师比较倾向将学生成绩差的

视为智力低。还有一些想索取赔偿金的病人常夸大病理感觉。可见，信息往往因来自不同的人而评定结果不一致，在利用信息时不能不注意。

3．“光环”效应（halo effect）

评定时受到不完全相关因素的影响，或者以总体印象代替具体特征，或者以偏概全，以致评定结果错误。例如：知其兄具攻击性便联想到其弟也具攻击性；知其病情严重，便判断各个症状均严重。

4．集中趋势（central tendancy）

一般人皆有集中趋势现象，为避免评定于极端，而多选择中间答案。

5．严格和宽容倾向

有些评定者倾向过于多方挑剔，评分过严；或者喜欢选用较优级别，给分过宽。

6．期待效应（Expectancy effects）

又称Rosenthal效应，历为首先由R.Rosenthal（1966）公开报告此现象而得名。日常生活中常见到这样的情况，在等待某人的电话时，一听这人的电话便立即听出他的声音，如果不正在等待他的电话时，便要问题来电话人的姓名才可辨，同一个的声音，在有无等待时，在分辩能力上的差异如此明显，这现象属期待效应。在评定某现象时，有无期待，对此现象的敏感度是不同的。在科学研究中，评定实验组对照出不出现某效果，如果评定者了解谁是实验组和谁是对照组，与不知道的结果不一样。这种不同，不是意识的，而是潜意识的。因此

好的研究设计，常用盲法评定，以提高其客观性。

三、如何提高评定量表的使用效用 1. 评定者的素质要求。 2．建立友好信任的关系 3．提高评定者动机 4．正确掌握评定方法 5．正确和合理使用评定量表

提高评定量表的铲用，一方面是评定量表应符合使用要求，这在前面内容已有充分的介绍，这里主要涉及评定者使用量表的效用。

应用评定量表的效果，与评定人员的选择是否适当，以及评定者是受过良好的训练关系至为密切。提高评定量表的使用效用，对评定者应有较高要求。

2．建立友好信任的关系

评定量表结果要精确，在进行评定时，评定者与受评者之间，一定要保持友好和信任的关系（rapport）。否则受评者不能合作，结果不准，甚至无法进行评定。

在与受评者建立友好、信任关系的过程中，评定者应起主导作用。要根据受评者的年龄、性格、经历以及所患疾病的性质调整自己的交往方式。

3．提高评定者动机

评定者应有机会直接观察被评者在所评定方面的行为，尤其对于某些不甚了解的评定项目，更需多花时间观察和搜集病人资料。有些评定员可能专业知识有限，如普通护士、护理员、保育员等，主要研究者应多与这些评定员一起讨论量表内容和评定结果，调动其参与意识，增进评定动机，以提高评定结果的可靠性。

4．正确掌握评定方法

评定结果要有效，就要严格按照量表使用手册规定方法进行评定。

大多数评定量表多为评定检查当时或过去一周或二周内情况但某些调查表如生活事件调查表则为过去一年内情况，应注意所使用量表的手册规定。量表使用间隔应根据具体的研究要求和所选用的量表种类而定，如评定药物疗效时，他评量表约每二周评定一次，自评量表则至少入组前后各评一次，如果不同评定者对所评定的行为或症状项目有不同判断标准时，最好由多人分别评定，再将评定结果加以平均。只有各评定者评定的等级差异较小时，所得的均数才有意思。

Spreat(1979)分析了284份美国智力低下协会的适应行为评定量表（AAMD ABS）记录，发现564处评分错误，即有简单的计算错误，也有较复杂的评分规则错误。因此评定结束前应仔细检查、有漏评、重复评定或其他填表错误时，应及时纠正。

应注意有的量表评定时，除给于评分外，还要求注明评分事实依据，或说明理由。当评定者对个别项目评分把握不定时，也可采用此方法。

5．正确和合理使用评定量表

评定量表的作用是使心理品质或社会现象数量化的主要手段之一，但这比物理的数虾仁经的难度大，加上现今的评定量表尚在发展中，并未达到“尽善尽美”的程度，所以在认识它的作用的同时，还要认识它的局限性。临床工作者若过于依赖量表评定，在发现评定结果与临床所见不相符或不能解决自己的疑难时，便走向反面，完全否定评定量表。心理卫生评估工作者如机械地只凭评定量表结果来作解释时，往往作出与实际不符的结论。所以阅读评定报告的临床工作者也要学习一点心理学和心理测量有关的知识。心理卫生评估工作者更要深入掌握心理测量技术，并学习与健康和疾病有关的心理学和社会学知识，提高自己综合利用有关资料能力，对评定结果作出符合实际的分析。这样就能说正确使用了评定量表。评定量表和其他检测手段一样，应用要合理。如果作了评定量表后可为心理卫生工作增加有用的信息时，那么就必须进行。如果所提供的信息对我们无用或作用不一定，或者它不过是重复我们已经了解的，那么就不必进行。

要注意防止滥用评定量表，评定量表应用合理，不仅是为了节省受评者的精力，而且具有维持较高的专业声誉的意义。甚至有时临床上有实施测评的需要，在受评者健康状况不允许时，或者评定者和受评者之间未建立友好信任关系时，暂时也不宜进行评定。

应注意到量表的社会文化经济背景对量表使用效用的影响，尤其近年来引进了一些国外编制的评定量表，如果内容与我国文化背景不符合，应修订后方能使用。即使这样，在使用这些量表时还应充分估

计文化差异所致的误差，尽量选用适合我国文化背景的量表。

四、关于一致性检验的问题

前面已经提到评定者能否正确使用评定量表，与对评定者的的训练关系密切，而评价其训练效果，了解受训者是否掌握了评定方法及其掌握的程度，一般都需进行一致性检验。评定者的一致性是指初学评定者在使用同一量表过程中其观察、记录和评分方面与熟练掌握者之间的一致性程度，或者为不同评定者相互间在这些方面的一致性程度，即评定结果的一致性。一致性程度越高，则评定结果就越可靠。一致性检验则是评价一致性程度的统计学方法。

进行一致性检验时，可以为量表初学者和熟练评定者同时对同一批受评者进行评定，独立评分，计算两者之间结果的一致性；也可为计算多名评定者按上面方式评定结果的一致性。一致性检验计算方法很多，主要根据研究者的使用精确性要求和资料类型来选择。这里介绍几种主要计算方法适用范围并作简要评价，供选择者应用时参考。

1．符合率（Percent of agreement, PA）

两个或两个以上评定者检查同一批受评者，计算评定结果完全一致的人数占所评定人数的比例。评定结果多为计算资料，如两类结果或多类结果。结果分类数不同，所采用的计算方法有所差异。总的来廛，这种方法是一种较简单的统计方法。一般符合率达75即可，达90%就比较理想，符合率只是对一致性粗略估计，其中含有机遇成份，故不很精确。有时符合率与卡方检验联合使用，如果符合率较高，评定者之间统计学差异又无显著性，则表示评定结果较可靠。

2．相关分析法（Correlation analyses）

两名或两名以上评定者独立评定一批受评定者，然后计算他们评定结果之间的相关程度，相关程度的大小用相关系数（coefficient of correlation）表示。计算两名评定者之间的相关系数，最常用的有Pearson积差相关法和Spearman等级相关法，前者适用计量资料，后者适用于计数资料。对多名评定者评定两种结果，要用组织内相关系数法（ICC）计算。多名评定者对多名受评者进行多种或多级评分，特别是每个对象的评定次数（即对该例进行评定的评定者人数）名不相同的话，只有使用借助方差分析的组内相关系数法（ICCviaANOVA），但需有计量性资料。前两种方法计算较为简单，后两种方法则很复杂。一般相关系数0.7以上即可接受，大于0.9则认为评定结果较可靠。相关系数仅表示评定结果之间的相关关系，并不表示真正的致。当评定结果存在明显系统性误差时，相关系数也可以很高，此种情况会导致评定者间结果一致性很高的错误印象，最好的解决办法是结合符合率或采用其他检验方法来进行考验。

3.Kappa系数法

Kappa系数法是一组衡量评定者结果一致性的理想的统计方法，既能排除符合率中的机遇成份，又能避免相关分析法中由于系统性误差所引起的高相关假象，但这套方法只适用于计数性资料。对两名评定者、两种评定结果的一致性检验，采有普通Kappa系数（K）计算方法即可；对两名评定者、多种评定（多级评定）结果，则需用加权Kappa系数（Kw）计算方法，邓我名评定者、多种评定结果则要用

泛用Kappa系数（GK）计算方法。一般要求Kappa系数大于0.5，则认为评定者之间一致性检验符合要求。限于篇幅，这里不作具体统计方法介绍，详见有关统计学专著和《中华神经精神科杂志》1986年第6期颜文伟著的《检验一致性的统计方法》一文。

表检验一致性方法评定结果类型 2种评定者人数 2人 PA 2种多种多种计量资料 ≥3人 2人 ≥3人 ≥2人数症状自评量表

（Symptom Checklist 90, SCL—90）

此表由Derogatis，L. R. 编制（1975），表的制订可追朔到在Cornell Medical Index(CMI)基础上，由Parloff，M. B. 制订的评定心理治疗并经Frank，J. D. 修订的不适量表（Discomfors Scale）。后来Derogatis以他编制的Hopkin’s症状清单（HSCL 1973）为基础制订SCL-90。此表包括90个项目。曾有58项版本及35项的简本，此处介绍90个项目的SCL-90，此表包含比较广泛的精神病症状学内容，

适用的统计方法 K、Kw、ICC、Spearman相关系数、ICC、GK、PA GK、Kw、PA GK、PA ICC via ANOVA、Pearson相关系如思维、情感、行为、人际关系、生活习惯等。

评定时间：可以评定一个特定的时间，通常是评定一周以来的时间。

评定方法：分为五级评分（从0~4级），0=从无，1=轻度，2=中度，3=相当重，4=严重，有的也用1~5组，在计算实得总分时，应将所得部分减去90。SCL-90除了自评外，也可以作为医生评定闰人症状的一种方法。

分析统计指标：（一）总分

1．总分是90个项目所得分之和

2．总症状指数（General Symptomatic Index），国内称总均分，是将总分除以90（=总分÷90）

3阳性项目数是指评为1~4分的项目数，阳性症状痛苦水平（Positive symptom distress level）是指总分除以阳性项目数（=总分÷阳性项目数）

（二）因子分：

SCL-90包括9个因子，每一个因子反映出病人的某方面症状痛苦情况，通过因子分可了解症状分布特点

组成某一因子的各项目总分因子分=

组成某一因子的项目数9个因子含义及所包含项目为：

1．躯体化（Somatization）：包括1，4，12，27，40，42，48，49，52，53，56，58共12项，该因子主要反映身体不适感，包括心

血管、胃肠道、呼吸和其他系统的主诉不适，和头痛、背痛、肌肉酸痛，以及焦虑的的其他躯体表现。

2．强迫症状（Obsessive-Compulsive）：包括了3，9，10，28。38，35，45，46，51，55，65共10项主要指那些明知没有必要，但又无法摆脱的无意义的思想、冲动和待业，还有一些比较一般的认知障碍的行为征象也在这一因子中反映。

3．人际关系敏感（interpersonal sensitivity）：包括6，21，34，36，37，41，61，69，73共9项。主要指某些个人不自在与自卑感，特别是与其他人相比较时更加突出。在人际交往中的自卑感，心神不安，明显不自在，以及人际交流中的自我意识，消极的期待亦是这方面的症状典型原因。

4．抑郁（depression）：包括5，14，15，20，22，26，29，30，31，54，71，79共13项。苦闷的情感与心境为代表性症状，还以生活兴趣的减退，运力缺乏，活力增失等为特征。以反映失望，悲观以及与抑郁相联系的认知和躯体方面的感受。另外，还包括有关死亡的思想和自杀观念。

5．焦虑（anxiety）：包括2，17，23，33，39，57，72，78，80，86共10项。一般指那些烦燥，坐立不安，神经过敏，紧张以及由此产生的躯体征象，如震颤等。测定游离不定的焦虑及惊恐发作是本因子的主要内容，还包括一项解体感受的项目。

6．敌对（hostility）：包括11，24，63，67，74，81共6项。主要从三个方面来反映敌对的表现：思想，感情及行为。其项目包括厌

烦的感觉，摔物，争论直到不可控制的脾气暴发等各方面。

7．恐怖（Photic anxiety）：包括13，25，47，50，70，75，82共7项。恐惧的对象包括出门旅行、空旷场地，人群，勤俭以共场所和交通工具。此外，还有反映社交恐怖的一些项目。

8．偏执（Paranoid ideation）：包括8，18，43，68，76，83共6项。本因子是围绕偏执性思维的基本特征而制订：主要指投射性思维，敌对，猜疑，关系观念，妄想，被动体验和夸大等。

9．精神病性（psychoticism）：包括7，16，35，62，77，84，85，87，88，90共10项。反映各式各样的急性症状和行为，有代表性地视为较隐讳，限定不业的精神病性过程的指征。此外，也可以反映精神病性行为的继发征兆和分裂性生活方式的指征。

此外还有19，44，59，60，64，66，89共7个项目未归入任何因子，分析时将这7项作为附加项目（additional items）或其他，作为第10个因子来处理，以便使各因子分之和等于总分。

当得到因子分后，便可以用轮廓图（profiles）分析方法，了解各因子的分布趋势和评定结果的特征。

此量表在国外已广泛应用，在国内也已应用于临床研究，特别是精神卫生领域，已广为应用。如对医学生考试应激的心身影响研究中，SCL-90总分由考试前24.05±31.27（P<0.01），各因子分均值亦皆有不同程度升高。除人际关系敏感及恐怖两个因子外，其集因子在考试前后均有显著差异（P<0.05~0.001）。考试前后SCL-90总分与生活事件总分，人格部分均呈显著正相关。与应对方式相关分析，发现消极

的应对方式，如自闭自责，听天由命等，与考试后SCL-90增分呈著正相关；而与积极的应对方式，如寻求社会支持，着重争取有利方面等则呈显著负相关（P<0.05~0.01）。若将SCL-90总分均值为界限，分为高症状组与低症状组，观察其PHA诱发的淋巴细胞转化反应，发现高症状组的淋转降低较显著（唐宏宇等，1992）。

用于痴呆病人照顾者的研究，发现SCL-90评分均高于对照组，其中总痛苦水平（GSI），阳性症状痛苦水平（PSDL）的均分以及抑郁、焦虑、敌对、偏执、精神病性等因子的痛苦水平与对照组相比，差异有显著性（P<0.05~0.01）。SCL-90与亲属应激量表（RSS）评分之间有显著正相关。

生活事件量表

（Life Event Scale, LES）一、LES的目的和背景

使用“生活事件量表”的目的是对精神刺激进行定性和定量。生活事件对心身健康的影响日益受到人们的重视，业已促进了医学模式的转变。许多研究报告了生活事件与某些疾病的发生、发展或转归的相关关系。可是，大多数这类研究的结果不尽一致，甚至相互到矛盾[1，2]。原因是多方面的，生活事件的评定问题就是其中之一。

在研究生活事件评定的初级阶段，人们只注重那些较重大的生活事件，因而只统计某一段时间内较大事件发生的次数。次数越多，表示遭受的精神刺激越强。这种评定方法非常简单，不足之处是显而易见的。不同的生活事件引起的精神刺激可能大小不一，丢失一件衣物

与经历一场浩劫是不能等量齐观的。于是，人们相信，每种生活事件理应具有其“客观”的刺激强度。从六十年代起，人们对各种生活事件的“客观定量”有了较多的研究兴趣。其中最有代表性的人物是美国的Holmes TH。他和Rahe于1967年编制了著名的“社会重新适应量表”（Social Readjustment Rcale，简称SRRS）。SRRS的理论假定是：任何形式的生活变化都需人个体动员机体的应激资源去作新的适应，因而产生紧张。SRRS的计算方法是在累计生活事件次数的基础上进行加权计分，即对不同的生活事件给予不同的评分，然后累加得其总值。SRRS加权的依据来自一个5000人的常模。在制定常模时，Holmes等事先规定的“丧偶事件”为1000分，“结婚事件”为500分，让被调查者以上述两事件的评为标准，按自己直接或间接的经验去评估其它种种生活的实际情况，是科学地、客观地评定生活事件的开端。SRRS被推广到许多国家，再研究的结果显示相关系数多在0.85-0.99之间[3]，被公认为评定生活事件的有效工具，甚至有人认为可以作为金标准以检测其它生活事件量表的效度。

我国于八十年代初引进SRRS[4]，使用者们根据我国的实际情况对生活事件的某些条目进行了修订或删增，有的将百分制改为十分制，有的则沿用Holmes的计分方法[4,5,6]这些生活事件量表的基本理论、计算方法均与SRRS类似，故它们与SRRS的一致性较高（r=0.643-0.887）。

SRRS及其类似的修订版比较适用于研究生活事件的客观属性和某一群体的价值取向。如果用于对个体精神刺激的评定或对生活事件

致病作用的研究。尚有一些没有解决的问题。

问题之一，同一生活事件在不同的性别、年龄、文化背景、及至同一个体的不同时期可能具有不同的意义。生活事件即便是一种客观存在，但要成为精神压力尚必须经过个体的主观感受。精神刺激的强度一方面受到生活事件本身的性质、特点的影响，另一方面更受到个体的需要、动机、个性、以往经历以及神经生物学特性的制约。比如，一般而方中年丧妻乃人生之一大不幸，然而对于夫妻情感弥佳或早已另有新欢的两个男了来说，这一精神刺激的性质和强度会迥然不同。如果不加分辨地按常措二人各记上100分，与实际情况便相差甚远。国内一个研究的结果表明，年龄就是一个重要的影响因素。不同年龄阶段的人对同一生活事件的感受差另很大，对80%的生活事件条目的评估竟有显著性差异[5]。可以说，不管人们对某一事件的看法与客观实际是否一致，也不管是什么因素影响了他们对事件的认识、判断和评价，唯有个体实际感受到的精神紧张才对健康构成真正的威胁。

问题之二，SRRS假定生活事件不管属积极性质或消极性质，都会造成精神紧张。而人们发现，消极性质的生活事件与疾病最为相关，而中性或积极性质的生活事件的致病作用却并不明显[7,8,12]。

基于上述两方面的原因，个体的精神刺激评定不宜使用常模的标准化计分，而应分层化或个体化。并应包括定性和定量评估，以分别观察正性（积极性质的）、负性（消极性质的）生活事件的影响作用。按照这种新的构想，我们在前人的工作的基础上编制了“生活事件量

表”（Life Event Scale，简称LES）。经过五年的实践和研究于1986年定型[9]，并已在国内十多个省市推广应用。

二、LES的适用范围

LES适用于16岁以上的正常人、神经症、心身疾病、各种躯体疾病患者以及自知力恢复的重性精神病患者。

三、LES的信度、效度[10,11,12,13] 信度：

对153名正常人、107名神经症患者、165名慢性疼痛患者、44名缓解期的精神分裂症患者在间隔2-3周后重测，相关系数在0.742-0.611之间，P值均小于0.01。

效度：

1）100名离婚诉讼者的精神紧张总值、负性事件值高于按年龄、性别、民族、学历、职业及婚龄配对的五好家庭成员(P<0.01)，而正性事件评分两组无差异。

2）十二指肠溃疡者精神紧张总值、负性事件值均高于无症状的乙肝病毒携带者（P<0.01），而正性事件差异不显著。

3）恶性肿瘤患者生活事件的发生频度、强度及总值高于结核病患者，差异具有显著性。

4）72名癔症者生活事件总值与反映其社会功能状况的大体评定量表分（Global Assessment Scale）呈负相关（r=-0.3303、P<0.05）。

四、LES的使用方法和计算方法

LES是自评量表，含有48条我国较常见的生活事件，包括三个

方面的问题。一是家庭生活方面（有28条），二是工作学习方面（有13条），三是社交及其它方面（7条），另设有2条空白项目，供填写当事者已经历而表中并未列出的某些事件。填写者须仔细阅读和领会指导语，然后逐条一一过目。根据调查者的要求，将某一时间范围内（通常为一年内）的事件记录下来。有的事件虽然发生在该时间范围之前，如果影响深远并延续至今，可作为长期性事件记录。对于表上已列出但并未经历的事件应一一注明“未经历”，不留空白，以防遗漏。然后，由填写者根据自身的实际感受而不是按常理或伦理道德观念去判断那些经历过的事件对本人来说是好事或是坏事？影响响应如何？影响持续的时间有多久？一过性的事件如流产、失窃要记录发生次数，长期性事件如住房拥挤、夫妻分居等不到半年记为1次，超过半年记为2次。影响程度分为5级，从毫无影响到影响极重分别记0、1、2、3、4分。影响持续时间分三月内、半年内、一年内、一年以上共4个等级，分别记1、2、3、4分。

生活事件刺激量的计算方法：

1．某事件刺激量=该事件影响程度分×该事件持续时间分×该事件发生次数

2．正性事件刺激量=全部好事刺激量之和 3．负性事件刺激量=全部坏事刺激量之和

4．生活事件总刺激量=正性事件刺激量+负性事件刺激量另外，还可以根据研究需要，按家庭问题、工作学习问题和社交问题进行分类统计。

本文来源：https://www.bwwdw.com/article/lk0p.html

相关文章：

正在阅读：

心理卫生评定量表概论04-12

高三数学文科解析几何讲义--双曲线09-16

存款证明所有问题汇总解答10-20

论文学作品对女性自我意识觉醒的影响以红楼梦和金锁记为例06-04

小学班主任班级管理随笔11-20

21 线性赋范空间05-13

快板台词:歌颂我美丽的家乡相关范文02-11

第9章物质代谢的联系与调节11-17

家庭高清音视频影音共享方案08-18

世界史近代史复习06-11

上一篇：电子教案下一篇：大连海事大学研究生招生专业目录2013