复习资料 第六章 社会研究中的测量

更新时间:2024-01-03 08:53:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章 社会研究中的测量 第一节 测量的概念和过程

一、测量的概念

社会测量是一种科学观察技术,它要求观察结果必须是可检验的,或者说观察程序是可重复的。

测量是人们通过现实世界细致的系统观察而把握某种现象存在程度的过程。 测量活动在日常生活和科学研究中都具有5个重要的作用:

(1)第一,测量可以使人们客观和精确地把握各种自然现象和社会现象存在的状况; (2)第二,测量工具通常比人的感官更敏感,因此通过一定工具而进行测量往往比仅靠人自身感觉的测量要精确得多;(如温度计对温度变化的感知程度,要比人用皮肤感知温度变化强很多。)

(3)第三,通过对自然和社会现象的测量,有时还可以发现一些未知的物体和现象;如用一定的测量工具可以帮助人们看到磁场这种用肉眼无法看到的东西。

(4)第四,靠一定标准化工具测量的结果不会随特定观察者而变化。如用秤给女儿秤体重,不会因为爸爸力气大,女儿就轻些。

(5)第五,测量还能帮助人们观察非物理世界的存在。(如聪明、漂亮、态度消极) 社会测量也是一种科学测量,它具备一切科学测量的3个基本要素:

(1)首先,它是按照一定程序的系统测量,每一步都有详细的记录,是可重复的、客观的和能被检验的;

(2)其次,它不仅有明确的目的,而且还是在一定理论背景下发生的;

(3)最后,它有精心设计的测量工具,特别是有针对类似偏见这样的非物理存在,发展出了特殊量表工具。

社会测量中,与自然科学测量最为接近的是定量测量,即针对表示某种社会属性的概念,构造出相应的测量工具,对之进行经验观察,并以数字形式表示观察结果。 二、测量的过程

一般说来,测量过程包括三个步骤:

(1)首先,对测量对象形成一定的概念。要把测量对象以概念形式表示出来,或者说对测量对象形成概念化认识,这就是“概念化”过程;如要测量经济发展、贫困程度等方面的情况,就应该首先有“经济增长率”、“贫困发生率”的概念。

(2)其次,对概念进行操作化的加工,将它们变成可测量的变量。针对需要测量的概念,构造相应的测量工具,这属于“操作化”的内容;构造指标是关键的一步,有了指标才能在经验层次上进行观察。构造提问属于问卷设计。

(3)最后,用测量工具对测量对象进行经验观察,这是“资料收集”的任务。

在测量过程,另一项工作是相伴而行的,这就是测量质量并进行评估,即根据一些标准来判断对社会现象的测量是否成功。测量的成功与否,主要靠信度和效度两项技术指标来评判。 所谓信度是指使用相同测量工具重复测量同一个对象时,得到相同研究结果的可能性,指的是测量的可靠性。效度是指测量工具在多大程度上反映了概念的真实含义,指的是测量的准确性。

第二节 概念化和操作化

一、概念化

概念化和操作化是测量的两个关键环节,前者对概念进行名义定义,从理论层次对概念的含义加以说明;后者对概念进行操作定义,从经验层次形成测量概念的工具性指标。

概念化是社会测量的第一个环节,是对概念含义和应用范围给予清晰说明的过程,即在理论层次上对概念进行名义定义。 进行概念化的原因: 1、是日常生活中,用来指称事物的概念含义经常是模糊不清的;例如说“某人有文化”,其中“文化”概念的含义就不够清晰,既可以理解为这个人识字,也可以理解为受过良好的教育,这样的概念难以满足测量,就需要对概念进行清晰明确的界定。

2、是由于有些测量对象纯粹是一种理论建构,如智商、偏见、失范和异化等,它们源于观察,但在现实中没有明确的对应物,其存在本身就是一种概念定义。

研究者经常用维度这个术语来指称概念的层面或具体方面。区分概念的维度,实际上就是对概念的含义进行分类,这有助于加深对概念的了解。 二、操作化

1、操作化的定义

想要具体测量这个概念,需要把概念抽象的名义定义进一步具体化,使其转化成能从经验上进行观察和测量的变量和指标,这个过程通常被称为操作化,即在经验层次对概念进行操作定义。

通过操作定义,概念转换为变量形式,即转变成了能有不同取值的概念。也就是说,变量是概念的具体化,可以在经验层次上观测,表明事物在数量、等级或类别上的变动状态。 可以直接观察的变量又称为指标,它比变量更加具体,直接从经验层次反映出概念内涵中某个层次的内容。

对多个维度,比较抽象复杂的概念,就必须用一组指标来测量,变量的经验观察只能通过指标观察结果的综合来实现,这种综合观察被称为复合测量,常见的形式包括量表和指数。 2、测量层次: 在量化测量中,测量指标的精确度是用测量层次来衡量的,按精确度由低到高,测量分为 定类测量、定序测量、定距测量、定比测量 四个不同的测量层次。

(1)定类测量 (是根据属性的不同对人或事件进行分类)不同的类别可用数字表示,相同的数字表示相同的类别。如您当前的婚姻状况?答案是1、未婚,2、已婚。

(2)定序测量 (不仅对属性进行分类,还根据属性强度的不同来进行顺序排列)如您的健康状况如何?1、非常好,2、不错,3、尚可,4、不好。

(3)定距测量 (以相等的固定间距(标准间距)来确定属性强度的实际距离)

(4)定比测量(是在确定了间距数字后,通过确定有实际意义的零点,将属性强度间的比例关系用间距数字间的比例关系表示出来,精确度最高的测量 。)许多重要的社会科学变量,如收入、年龄都有符合定比测量的要求。

第三节 指数与量表

一、指数与量表的概念

指数与量表是测量抽象概念的常用工具。 在社会研究中,量表是一种将所测量的复合变量的各个方面都按同样的方式将其可取值按一定顺序排列出来的测量工具。在实际的社会测量中,量表就像一把有刻度的尺子一样,用来测量人们某种社会现象的态度、意愿以及某种社会特征存在的程度。(如测量对某一事物是否赞同的态度时,可以采用一个五级量表,1=完全赞同2 =比较赞同3=无所谓4=不太赞同 5=完全不赞同)

在实际测量中,由多个指标构成的指标群,通常被整合为某种指数。指数是将多个指标整合为一个单一的分数。

利用指数这个工具去测量个人和社会的某种特征,可以在给个人或社会的许多相关方面的表现进行打分的基础上,通过将这些分数加以整合形成一个综合分数,最终反映出此个人或社会特征存在的状况。

量表和指数都是对抽象概念进行复合测量,即基于一项以上资料的测量。如,对漂亮和气质给出的分数,都是根据多方面表现的综合评分。

另外,虽然量表测量得到的是从小到大的连续分值,但从测量层次看,量表测量仍属于定序测量层次,因为量表得分之间不存在标准等距。 指数与量表的差异

(1)量表和指数的得分方式是不一样的。量表是根据被测量对象对问题的回答强弱程度,给予不同的得分;而指数是根据被测量对象选择指标的多少,给予不同的得分。

(2)量表不仅能测出变量的大小,而且还能反映出变量的强弱结构,因此能获得比指标测量更多的信息。

(3)虽然量表测量得到的是从小到大的连续分值,但从测量层次看,量表测量仍属于定序测量层次,因为量表得分之间不存在标准等距。同样的理由,指数测量也应该属于定序测量层次,但是,在实践中,许多研究者从便于统计分析的角度考虑,都将指数测量作为定距测量或定比测量层次的测量来使用。

(4)从使用频率看,指数比量表运用得更加频繁。

指数的建立包括以下3项技术:

(1)指标的选取 (建立指标数的第一步是选取符合标准的指标,首先,要尽可能挑选表面效度较高的指标,其次,要对不同指标进行相关性检验)

(2)指标的加权 (在按一定标准选定指标后,进一步要考虑每个指标在指数中构成的分量如何,也就是考虑加权问题。加权是给指数中的某些重要指标赋以特殊的分量)

(3)处理缺失值 (无论是何种方法收集到的资料,都会出现资料缺失的情况。产生数值缺失,就可能是影响整个指数的信度和效度。)

处理缺失值的方法:第一、如果数据中缺失值占的比重不大,如在3%—5%之间,可以考虑删除那些含有缺失值的被访者。第二、如果指数有多个指标,可以考虑用已有数据的平均值来代替缺失值。第三、在大样本和指标较多的情况下,还可以用随机方法给缺失值赋值。 三、量表类型 1、李克特量表

美国心理学家李克特在20世纪30年代,将答案从两种选择扩展成了4种:非常同意、同意、不同意、非常不同意。清楚的顺序回答形式,是李克特量表最大的优点。 李克特量表的答案类别应保持在4~8个之间,最好能包含类似“不知道”、“未决定”“没意见”等中性类别。

在实际测量中,一般总是针对某个议题的不同层面,设计出不同的陈述,分别用李克特量表进行测量。然后将每一个陈述的测量得分的进行加总,用加总后的综合得分,来代表对该议题的测量结果。这种形式的测量又被称为李克特总加量表,简称为总加量表或李克特量表。(李克特量表属于定序测量)

按照李克特量表的形式设计出来的、可以用来测量“自尊心”的是罗森伯格量表 。 2、语义差异表

语义差异表是20世纪50年代发展出来的,主要用来测量人们对观念、事物或他人的感觉。 以形容词正反语义为基础建立的量表,被称为语义差异量表。 从语义上看,形容词大致分为三大类:评价(好与坏)、力度(强与弱)、行动(主动与被动),其中,最经常使用的是评价。

进行语义差异测量时,首先要确立测量客体;然后选择3~15组语义相反的形容词或短语,他们应能够显示出测量客体在某个方面的对立形象。接下来,准备一份计分表,让被访者对测量客体表达自己的感受,注意使每对语义相反的形容词之间含有7~11个评分点。

第四节 测量质量的评估

对测量质量进行评估,就是依据一些标准来判断测量的信度和效度。

一、信度信度是指相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具、测量设计本身的特征而发生变化,反之亦然。常用的几种信度:再测信度、复本信度、折半信度。 1.再测信度又称为稳定性信度,是用同一种测量工具,在两种不同场合对同一群受试者前后测量所得到结果的一致性程度。

相关系数反映的是测量分数的稳定性程度,故称为稳定性信度。

再测信度是最简单、最直接评估信度的方法,但它存在着不足之处,即第一次测量产生的“练习效应”,会对第二次测量产生影响。如幼儿园希望了解儿童口头表达能力,分别在今年5月和7月进行了两次内容相同的测试,两次所得结果的一致性程度也是再测信度。 2.复本信度是在一个测量中采用两个或两个以上的复本来对同一群研究对象进行测量时所得到结果的一致性程度。

复本信度是等值性信度的一种,它比再测信度的工作量大。相关系数反映的是测量分数的等值性程度,故复本信度又称为等值性信度。

3.与再测信度中“练习效应”产生的困难一样,复本信度中完善的复本是很难构造的。为了克服复本信度操作上的困难,心理学家斯皮尔曼使用了一种变通的方法,即只用一个测量工具对同一级一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数,即所谓的折半信度。 二、效度

效度是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结

果越能显示其所要测量的特征。社会研究中常用的效度:表面效度、内容效度、效标效度。 1.表面效度

表面效度是指测量结果与人们头脑中的印象或学术界形成的共识之间的吻合程度,如果吻合程度高,则表面效度就高。

测量是否有表面效度,主要是基于个人的主观判断。

表面效度是最容易评估,也是最基本的效度类型,但没有被学术界广泛接受的效度类型 。 2、内容效度

内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵。测量工具代表了概念定义的内容越多,则内容效度就越高。可见内容效度实际是在检查由操作化得到的经验指标是否能够比较全面地代表概念所包含的内容。

概念定义往往会包含数个维度或层面,具有内容效度的测量工具应该是所有层面的代表。如果测量“社会阶层”的测量工具只包含“收入”一个指标,就明显缺乏内容效度。

内容效度的测定也是通过主观判断来实现的,但由于有概念定义作为客观依据,因此,随意性比表面效度小。 3、校标效度

效标效度又称“准则效度”,是指测量结果与一些能够精确表示被测概念的标准之间的一致性程度。根据比较标准与测量结果之间是否在时间上有延迟,又可将效标效度分为预测效度和同时效度两种类型。

预测效度:是指测量结果与测量对象在一段时间以后的表现(预测标准)之间的相关程度,相关程度越高,则预测效度也越高。 同时效度:寻找一个已被断定具有效度的现有指标作为效标,它与测量结果之间的相关程度称为同时效度。两者之间的相关程度越高,则同时效度也越高。 三、信度与效度的关系

信度与效度的关系:信度和效度是评估测量质量的两个标准,二者之间存在着一定的关系;信度是效度的 必要条件,但不是效度的充分条件。一个测量工具要有效度就必须有信度,没有信度就不可能有效度(必要条件);但有了信度不一定有效度(非充分条件)。

有效的测量,一定是可信的;不可信的测量,一定是无效的;可信的测量,不一定者是有效的。

本文来源:https://www.bwwdw.com/article/xeox.html

Top