多层线性模型的解读:原理与应用

更新时间:2024-04-06 19:41:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

多层线性模型的解读:原理与应用

浙江师范大学心理研究所 陈海德

Chenhaide351@126.com

一、多层数据结构的普遍性

多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。

传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。学生数据层中,不同变量之间的关系可能因班级的不同而不同。因此,学生层的差异可以解释为班级层的变量。

另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。可以探索个体在发展趋势上的差异。 二、传统技术处理多层数据结构的局限

如果把变量分解到个体水平,在个体水平上分析。但是我们知道这些学生是来自同一班级的,不符合观察独立原则。导致个体间随机误差相互独立的假设不能满足。

如果把个体变量集中到较高水平,在较高水平上进行分析。这样丢弃了组内信息,而组内变异可能占了大部分。 三、原理

☆水平1(学生)的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同(不同的班级),其回归方程的截距和斜率也不同的,是一个随机变量。如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。

☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。

参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。这些方法代替了传统的最小二乘法估计,更为稳定和精确。比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。 四、应用

1 用于类似组织管理、学校教育等具有多层数据结构的领域研究。

2 用于个体重复测量数据的追踪研究。测量层面作为第一水平,个体层面作为第二水平 3 用于做文献综述,即对众多研究成果进行定量综合。探讨不同研究中进行的处理、研究方法、被试特征和背景上的差异与效应之间的关系。

4 充分利用多层模型较为高级的统计估计方法来改善单层回归的估计和分析。 五、优势

1 由于多层线性模型建立在更合理的假设之上,考虑到了来自不同层次的随机误差和变量信息,因此能提供更加准确的标准误估计、更有效的区间估计和假设检验。

2 多层线性模型可以计算任何水平上测量的协方差,如可以通过计算不同水平变异在总变异中占的比率来确定不同水平对因变量的影响程度,例如研究者可以探讨班级和学生的其他特征对因变量变异的作用到底有多大。还可以分析不同水平上变量之间的交互作用。 3 可以发现所得回归方程中,截距和斜率之间的相关关系,以便更好地解释自变量和因变量之间变化的规律。

4 多层次分析不仅可以用于分析观测变量之间的因果关系,而且作为协方差结构模型的拓展,可以分析具有多层结构的潜变量之间的因果关系,即建立多层水平结构方程模型。 5 不仅可以分析层次结构数据,还可以分析重复测量数据。测量看成第一水平,测试个体看成第二水平。

6 不仅可以分析服从正态分布的连续数据,也可以分析离散型的数据,如二项分布和泊松分布的数据。

7 使用范围较广,传统单因素方差分析、回归分析都是多层分析模型的简化(假设两个水平模型中有一个水平的变量为常数)。 8

六、注意

1 如果数据不具备结构性,则不必用层次分析。用传统的单水平分析模型可以得到更好解释。 2 虽然用多层分析可以更准确地描述事物间的因果关系,但它不能用来建立理论,不能代替专业理论方面的分析。

3 仍然以线性和正态的假设为基础。

4 仍然是研究几个变量预测一个变量的相对简单回归结构

七、步骤与结果解释

第一水平变量x,第二水平变量1为w,第二水平变量2为u,因变量为y

1 无条件均值模型(零模型):不加入任何自变量,回答是否同一群体具有较大相似性,即第二水平随机变异显著是进行后面模型分析的基础,如果不显著则没有必要进行多水平分析。

1.1固定部分的参数估计:y的总体平均值估计

1.2随机部分的参数估计:群组之间是否存在显著差异?群组之间的相关(跨级相关:

ICC)?群组变异在总变异中占的比例?

1.3 描述模型拟合的差异统计量。比如Deviance=1200

2 无条件增长模型(随机效应模型):回答的问题是因变量y和自变量x是否有线性变化的趋势,以及这种线性变化趋势是否存在群体间差异。模型中不加入第二层水平的自变量 2.1固定部分的参数估计:y和x的关系(截距和斜率)

2.2随机部分的参数估计:第一水平的截距和斜率是否会随着第二水平的变化而变化。 2.3 描述模型拟合的差异统计量。比如Deviance=900,与零模型相比,减少了300,如果

减少的300达到显著,则说明加入了第一水平变量,使模型拟合显著提高。

3 全模型(混合效应模型):回答的问题是第二水平中哪些变量对x-y关系(即斜率和截距)有影响,影响程度多少。

2.1固定部分的参数估计:第二水平变量(w1、w2?)对x-y关系(即斜率和截距)的影

响是否达到显著。对截距影响显著,则说明第二水平中的w1、w2变量对因变量y有显著影响;对斜率影响显著,则说明w1、w2变量对x-y关系有显著影响。

2.2随机部分的参数估计:检验引入第二水平变量w1、w2后,模型中变异的减少程度,说明了引入w1、w2的必要性,以及它们解释多大程度的变异。另外,检验除了考虑第二水平变量(w1、w2?)的作用外,x-y关系(即斜率和截距)的变异是否依然显著,说明是否还需考虑其他第二水平上的因素。

3.3 描述模型拟合的差异统计量。比如Deviance=850,与无条件增长模型相比,减少了

50,如果减少的50达到显著,则说明加入的了第二水平变量,使模型拟合显著提高。

本文来源:https://www.bwwdw.com/article/ndbr.html

Top