《社会研究的统计应用》复习大纲

更新时间:2023-09-18 20:32:01 阅读量: 幼儿教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

社会研究的统计运用(陈登源)

第一章 科学方法与社会研究历程 ▲选择或填空题

1、 社会学在规划一项研究时,大致上可以分为下面的五个阶段与步骤:选定研究项目、初步探索、成立假设、理论解释与澄清概念、研究策略

2、 用上多个指标时,为便于分析,有时候也需要将各项指标合并起来。合并的方法有:类型法、指数构成法、尺度法(综和尺度法、感觉尺度法、累加尺度法) 3、 测量层次由低到高分为四个层次:定类(区分异同)、定序(区分异同、次序即大小)、

定距(区分异同、次序即大小、加减)、定比(区分异同、次序即大小、加减、乘除),低级拥有的数学特质,高级更应当拥有,但高级拥有的,低级不一定拥有。划分定类层次时,要注意两个原则:一是互斥性,二是无遗性

4、 抽取样本以后,就要收集资料,收集的方法:访问法、观察法、档案资料

5、 一份问卷可能有许多不同的问题:但答案的方式主要有两种:一种是固定答题,另一种是自由答题

6、 用问卷收集资料的方式又可以分为两类:自填和对答,自填又分为邮寄和当面填写两类,对答又分为电话访问和面对面访问。 7、 观察法分为参与观察法和非参与观察法

8、 收集资料资料以后便要进行整理,在整理资料时一般分为两步:校对和编码。 9、 总结的步骤如下:统计分析、解释研究结果、理论贡献与实际贡献、要提供若干新的研

究项目 10、一个严谨的研究,在未分析变项与变项之间的关系之前,应该先检验每个的测量信度和测量效度。

11、社会学研究的一个重要环节:统计分析,要了解它的作用,就要了解整个社会学研究的历程,包括怎样规划一项研究,怎样落实研究计划,和怎样总结研究的成果。

12、社会调查法可以分为两类:叙述性调查和解释性调查

13、社会学研究就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。 14、定距层次就是具有值与值之间的距离,具有加与减的数学特值。

15、定序层次就是能确定值的次序,即变项的值能把研究对象排列高低或大小。 定类层次只能把研究对象分类。 第二章 简化一个变项之分布 ▲填空或选择题

1、 适用于简化一个定类变项资料的方法有:次数分布(最基本)、比例、比率、图示(长

条图、圆瓣图)、对比值等;定序层次除以上外,还有累加次数、累加百分率;定距层

次拥有以上方法,还有组限(真实下限=标示下限-0.5,真实上限=标示上限-0.5)、组中点=真实上限和真实下限的平均数。

2、 适用于每一类测量层次(定类、定序、定距)的单变项叙述统计法,要坚持一个原则,就是适用于较低测量层次的统计法,也适用于较高的层次。 3、 社会学研究常用平滑曲线来表示定距变项的资料分布:这些曲线有J 形曲线、U形曲线、峰状曲线、对称与不对称曲线。

4、 众值就是次数最多之值,适合于分析定类变项,也适用定序变项和定距变项。 5、 集中趋势测量法有:众值、中位值、均值,离散趋势测量法有:离异比率、四分位差、

标准差、质异指数。

6、 正态分布具有单峰和对称的特质,因此,众值、中位值、均值是相同的。标准正态分布

1

的均值是0,标准差是2.4。两个标准值的范围(面积)在位于同一边时相减,在不同两边时用加。

7、 集中趋势测量法就是找出一个数值来代表变项的资料分布,以反映资料的集结情况。 8、 离散趋势测量法是要求出一个值来表示个案之间的差异情况。 第三章 简化两个变项之分布

▲选择或填空题

1、 相关指一个变项的值与另一个变项的值有连带性。 2、 正相关是指一个变项的值在增加,另一变项的值也增加。 3、 负相关是指一个变项的值在增加,另一变项的值在减少。

4、 相关测量法,就是一个统计值表示变项与变项之间的关系,这个值,通常称为相关系。 5、 PRE的数值愈大,就表示以 x值预测 y值时能够减少的误差所占的比例愈大;也就是

说x 与y的关系愈强。

6、 PRE介于0和1之间的数值如果越大,就表示相关的程度越强。PRE=1,反映x 与y

是全相关。PRE=0,反映x 与y是无相关。 7、 PRE的数值意义就是表示用一个现象来解释另一个现象时能够减除百分之几的错误。 第四章 相关测量法和测量层次

▲填空或选择题

1、 两个定类变项测量层次有(1)Lambda(一是对称形式,另一非对称形式)只用部分边

缘次数和条件次数,其统计值介于0 与1 之间,(2)tau-y测量法(只使用不对称形

式)包括全部边缘次数和条件次数,故其敏感高于Lambda,其统计值介于0 于1之间(3)列联相关系数(4)v相关系数(5)phi 相关系数,前面两个具有消减差比例的意义,后面三个不具有。

2、 两个定序变项有:古德曼和古鲁斯卡的Gamma系数(对称相关测量法)、萨默斯的dy

系数(不对称)其系数值介于—1和+1之间,表示相关的程度和方向,都具有消减误差比例的意义。 3、 级序相关测量法有古德曼和古鲁斯卡的Gamma系数(对称相关测量法)、萨默斯的dy

系数(不对称)、肯德尔的tau系数( tau—a tau—b tau—c)(对称)其值没有消减误差比例的意义、斯皮尔曼的 rho系数(对称)其统计值又—1到+1之间,其平方值具有消减误差比例的意义。

4、 两个定距变项的b 值是表示自变项对依变项的影响的大小和方向,它是一个分析不对称

关系的统计法,其值不限于—1到—1之间,而r值假定x 与y的关系是对称(对称相

关测量法),其值由—1到+1之间,其平方值具有消减误差比例的意义。R系数越大,就表示线性回归方程式的预测能力愈强。

5、 一个定类变项和一个定距变项:相关比率,又称eta平方系数,其值是由0到1之间,

其平方值具有消减误差比例的意义。它还可分析非线性关系。

6、 一个定类变项和一个定序变项:1)威尔科森的区分系数,又称theta系数(不对称),其

系数值是由0至1之间,但没有消减误差比例的意义。2) Lambda 7、 在选择相关测量法时,首要的准则是变项的测量层次,次要的是考虑关系的对称与否。 第五章 抽样与统计推论

▲填空或选择题

1、 社会学研究关心的是总体的情况,不是样本情况,从样本中计算出来的数值称为统计值,在总体中的数值称为参数值。只要我们是采用随机抽样法,就可以根据抽样分布,以样

本的数值来推测总体的情况。

2、 求取一个有代表性的样本,减少抽样误差的五个步骤:界定总体、搜集全部名单、决定

2

样本大小、选取样本个案、评估样本之正误

3、 非随机抽样法有:立意抽样法、偶遇抽样法、定而抽样法 4、 随机抽样法有:简单随机抽样(最简单、最基本)、系统随机抽样、分层随机抽样、集

体抽样法、多段抽样、多期抽样 5、 均值的抽样分布的特征:(1)样本相当大(2)抽样分布之均值就是总体之均值(3)抽样分布的均值两旁,包括多少个样本均值 6、 统计推论一般分为参数估计和假设检定

7、 立意抽样法又称判定抽样法,是根据研究员的主观和判断,选取他认为是典型的个案。 8、 偶遇抽样法是选取一些遇见的个案作为样本,这个方法又称方便抽样法。

9、 定额抽样法是根据某些标准将总体分组,然后用立意或偶遇抽样法由每组中选取样本个

案。

10、简单随机抽样要求每个个案被选取的机会是相同的,系统随机抽样首先将全部个案排列起来,按抽样比例分成间隔,并在第一个间隔内选取第一个个案,然后每经一个间隔就选取一个个案。

11、参数估计就是根据一个随机样本的统计值来估计总体之参数值是多少。

12、假设检定就是先成立一个关于总体情况的假设,继而抽取一个随机样本,然后以样本的统计值来验证假设。 第六章 参数值的估计 ▲填空或选择或判断

1、 在样本大小相同的情况下,如果要求的可信度愈大,则间距就会越大,这个间距称为可

信间距,它与样本的大小成反比。 2、 在正常的情况下,样本越大就越有代表性,因此,在决定样本大小时,坚持的原则:(1)

在能够付出的研究代价以内,选取最大的样本(首要的准则)(2)用意容忍多少错误(3)所研究的个案之间的相互差异有多大。

3、 间距估计就是以两个数值之间的间距来估计参数值,至于间距的大小,就要取决于我们在估计时所要求的可信度是多少。

4、 点值估计就是以一个最适当的样本统计值来代表总体的参数值。

第七章假设检定:均值与百分率 ▲选择或填空题

1、 显著度越小,便越难否定虚无假设,也即越难证明研究假设是对的。如果所选定的显著度相同,二端检定比一端检定跟难否定虚无假设。

2、 用做检定假设的推论统计方法有:参数检定法(Z检定法,它要求大样本,n?100以上;

和T检定法n?30,要求自由度;F检定法,也称为方差分析法,两个变项中有一个是

定距变项),这三个要求总体具备某些条件,如(1)正态分布或标准差,(2)而且变项的数值具有定距变项数学特值,(3)随机抽样 。非参数检定法即分布自由检定法(x2检定(两个变项都是定类变项、随机抽取) 、 u 检定 、k —s检定、走动检定)它不要求使用于定距测量层次,适用于定类或定序资料。

3、 如果只有两个样本,那么两个样本均值的差异的检定方法有f检定法、Z检定法、T检

定法 4、 无论样本的大小如何,都可用T检定法,Z检定法可以说是T检定法的特殊情况。 5、 如果检定值是在否定域范围内,可以否定h0,即h1可能是对的,否则的话,就不能否定h0,也h1即可能是错误的。

6、 否定域就是抽样分布内一端或两端的小区域,如果样本的统计值在此区域范围内,则否

定虚无假设。

3

7、 显著度表示否定域在整个抽样分布中所占的比例。显著度越小,便愈难否定虚无假设h0. 8、 甲种误差是指否定h0,但实际上h1是对的错误可能性。乙种误差是指不否定h0,但实

际上h0是不对的错误可能性。

9、统计法的检定力是指该统计法能够准确地判断虚无假设(h0)的正误能力。

10、自由度是指有多少个案的数值可以随意变更, t的抽样分布形状取决于自由度。 第八章 假设的检定:两个变项之相关 ▲选择或填空题

1、x2检定:适用范围(1)两个变项都是定类变项、随机抽取(2)一个定类变项,一个

定序变项,它用于右端检定,x2愈大,就是h0的正确可能性越小。 2、Gamma:要求两个定序变项,它常通过s检定来检定G,在总体中,s=0,G=tau=dy

=0

3、单因方差分析中的F检定要具备的条件:(1)随机样本(2)有一个变项是定距变项、(3)正态分布(4)相等的方差

4、F检定,右端检定,最适合于推论一个定类变项和一个定距变项的关系,一个定序变项和一个定距变项也可以。 5、x2 分布最适用于两个定类变项的关系,一个定类变项和一个定序变项也可以, 9、 u 检定 (两个样本)、k —s检定、走动检定这些非参数检定法来推论一个二分变项与

一个定序变项的关系,即检定两组个案在等级排列上是否有分别,u检定最使用于分析一个二分定类变项和一个定序变项的关系,如果要检定三个或以上的组在级序上的差异用H检定(三个样本)

10、所有的检定假设方法的共同点:(1)只使用随机抽样样本(2)其关心的都是总体情况,不是样本的情况,(3)目的都在了解在总体中是否相关,而不是相关的强弱程度。任何的假设检定法都是样本越大时越难否定虚无假设。 第九章 详析模式和统计控制 ▲选择或填空题

1、多变项分析可依据研究目的分为三大类:详析分析(又可以依其作用不同分为因果分析、阐明分析、条件分析)、多因分析、多项相互分析 2、因果分析的作用是要检定自变项与依变项之间是否有因果关系,在因果分析中,第三类变项被称为前置变项。在控制w以后,研究结果原则上有三种可能性:(1)x 与y的关系消失(2)x 与y的关系维持原状(3)x 与y虽有关系,但其相关程度弱小了。

3、在阐明分析中,也可用分表法,将分表的统计值与原表比较,就可知道情况:(1)完全阐明,(2)不能阐明,(3)部分阐明 4、净相关系数以积矩相关系数r为基础,它是对称相关测量法的一种,要求变项之间是线性关系,且必须是定距变项,其值—1到+1之间,其平方值具有消减误差比例的意义。 5、因果分析的作用,要签定自变项与依变项之间是否确实有因果关系。这种分析,又称为辩明模式。

6、阐明分析的作用就是要以事实来验证:x是通过某些因素而对y产生影响的。 7、条件分析就是以第三类变项作为基础来了解x与y在不同情况下的关系。

8、 x与y本来是没有关系的,但在标明若干条件以后,x与y显然是有关的。这种情况称为压抑分析。

9、 曲解分析把原先的负相关变为正相关或把原先的正相关变为负相关的分析。 10、净相关分析就是以一个系数值来表示在控制第三类变项以后x与y 的相关。 第十章 多因分析 ▲选择或填空题

4

1、在社会学研究中最常用的多因统计法有:复相关系数、多因线性回归分析(多因分析)、虚构分析、因径分析、判别分析、典型相关分析、方差分析和协方差分析

2、复相关要求全部变项是定距变项,其值在0和1之间,统计值越接近1,表示相关越强, r的平方值具有消减误差比例的意义。它的剩余误差为1—r2.

5、 多因线性回归分析要求全部变项是定距变项,以两个或以上的自变项来预测一个依变项的数值,同时比较各个自变项的影响力的大小。

6、 积矩相关是对称的相关测量法,而回归系数b是不对称的,见249页

7、 上述的复相关系数、多因线性回归分析都是假定各个自变项的效果是直线性的。

8、 逐步回归是使各个自变项依先后次序进入回归方程式,谁先谁后,取决于统计的重要性

和理论要求。

9、 将每个定类变项或定序变项变为一组虚构变项,因为虚构变项是定距变项,就可以适合

于研究定距变项之间的关系的统计方法来分析资料了。虚构变项不假定是直线关系,因而可以显露非直线的效果。

10、典型相关分析两边都有多个变项,它的作用是测量两组变项的最大相关,其值是由0到1之间。典型相关的平方值(称为特征值或潜根)具有消减误差比例的意义,要求全部变项是定距变项。并且两组变项的相关具有对称关系。典型相关可用来分析两组虚构变项的相关。一般来讲,样本越小和变项数目越多,做典型相关分析时犯错误的可能性越大。当两变项组中有一组是只有一个变项时,典型相关就是复相关。

11、判别分析是以多个定距变项来判断两个或以上组别的异同性,以预测该个案属于何组,可以依据判别系数值来推算每个个案应属于每组的几率。

12、多个定类变项与定距变项的关系称为多因方差分析,两个定类变项与一个

定距变项的关系称为二因方差分析 第十一章 因径分析 ▲选择或填空题

1、在因径分析时,要遵循的原则:(1)变项分类(外生变项、内生变项和先决变项)、(2)每个内生变项都受其先前的变项所决定、(3)每个变项的都话为标准值,即以0为均值和1为标准差。)。 2、由多个变项所组成的因果网可以分为两大类:单向模式(可逆)和非单向模式(不可逆) 进行单向模式的因径分析时通常要假定成立的条件:(1)要求全部变项是定距变项(2)变项间的关系是线性的(3)多因效果是相加性的(4)剩余变项是不相关的,即是独立的。 3、因果网是根据我们的理论而推理而成立的,所组成的单向模式分为三个:完整单向模式(因果网内所有因果路径都存在)、部分含蓄单向模式、缺径单向模式。 4、因径系数就是标准净回归系数,它都是根据各个变项的标准值计算出来的,如是随机样本,可以用F检定每个因径系数的显著度。

5、因径分析就是把多因分析与详析这两类方法结合起来,使我们得以理解因果网内变量间

的复杂关系。 第十二章 定类或定序依变项回归分析

▲选择或填空题

1、当定类依变项为二分变项时,普通线性回归方程仍可使用,但有其局限性:其一是数学上的,其二是实质解释上的。

2、对二分依变项的描述有:几率、比率。

3、所谓拟然就是观察数据的联合几率,观察几率取决于二项分布的参数和观察值

4、对数几率回归和对数线性模型两个都检验总体拟合优度的统计量很多,常用的方法:对数拟然比卡方和皮尔孙卡方统计量。

5

本文来源:https://www.bwwdw.com/article/248h.html

Top