如何用统计软件SPSS进行英语测试分析

更新时间:2023-07-29 22:57:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

SPASS

第23卷第1期              咸 宁 学 院 学 报           Vol.23,No.12003年2月             JournalofXianningCollege           Feb.2003文章编号:1006-5342(2003)01-0089-05

如何用统计软件SPSS进行英语测试分析

胡 惮

(咸宁学院 英语系,湖北 咸宁 437005)

Ξ

摘 要:语言测试是外语教学中极其重要的组成部分,是检查、促进教学的重要手段。测试的结果可以为教学提供反馈,帮助教师了解学生的学习情况,改进教学方法。而对测试结果的分析,需要科学的工具方法。本文以一组测试成绩数据为例,探讨了如何用统计软件SPSS对测试成绩原始数据进行科学的统计分析,从而为教学提供指导性的反馈意见。关键词:语言测试;统计;SPSS

中图分类号:H087         文献标识码:A  测试与教学是密不可分的。通过考试手段来测评教学质量,古今中外,概莫能外,到目前为止,还未找到一种公认且被大众普遍接受的更为合宜的取代方式[1]。在《中国大百科全书》教育卷中,将考试概括为“学校检查学生成绩和教学效果的一种方法”。我们认为,“作为教育测量的重要工具”只是考试的一般含义。考试应该还是教学结果的反馈(学校意义),是甄别人的知识技能和智力开发不可缺少的手段(社会意义)[2]。科学的测试结果可以为教学提供良好的反馈,帮助教师了解学生的学习情况、改进教学方法,提高教学质量,还可以帮助学生进一步明确教学要求,改进学习方法,提高学习效果。因此,认真处理好教学与测试的关系的确是教学过程中的一个重要问题[3]。

但是,我们获得的测试分数只是一些原始的数据,这些数据若不经过科学的处理并不能为我们提供科学的反馈信息,使用不当甚至可能适得其反。对数据的有效处理,涉及到测试学、心理学和统计学等多方面的知识。然而,在我们的日常教学过程中,很多教师对测试结果仅仅统计出平均分、最高分、最低分、及格率、优秀率了事。这样简单的分析,对于我们掌握学生的学习情况,从而制订出进一步的教学计划,往往是很不够的。我们应当合理运用统计学工具,对测试结果作出深层次的分析。只有这样,我们才能获得真正有价值的反馈数据来指导后续的教学活动。

SPSS(StatisticalPackagefortheSocialScience,社会学统

影响的三大统计软件。SPSS名为社会学统计软件包,这是为了强调其社会科学应用的一面(因为社会科学研究中的许多现象都是随机的,要使用统计学和概率论的定理来进行研究),而实际上它在社会科学、自然科学的各个领域都能发挥巨大作用,并已经应用于经济学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域[4]。SPSS提供一个使初级用户易于使用、使熟练用户更方便地应用统计分析的用户界面。简单的菜单和交互式对话框使复杂的分析成为可能,而不需要学习语法编程操作[5],因此是我们用来进行测试分析的最理想的工具。

本文拟以某班两次英语测试的真实成绩样本为例,简要介绍如何利用SPSS进行英语测试分析。本文分析所用软件版本为SPSS8.0forWindows。

一、数据背景

我们分析所用的测试数据来源于武汉某知名理工大学。该校共有60个英语教学自然班,学生对象主要为理工科专业。在二年级上学期,该校举行了两次大规模的英语四级考试摸底预测。一次在3月6日,另一次在4月10号,两次测试中间时间间隔约为一个月。我们随机抽取了其中一个有36名学生的自然班的成绩作为样本。因为我们的研究主要是为了示范性地探讨该班学生的英语学习情况,并不代表该校或该地区乃至全国的英语整体教学水平,所以数据的采样是合理的。

测试所用的试题为以往历年四级考试的真题,试题的信度、效度、难度和区分度都是经过严密的科学测算的,因而其测试结果也是可信的。

试卷的结构如下表所示:

计软件包)是世界上著名的统计分析软件之一。它和SAS

(StatisticalAnalysisSystem,统计分析系统)、BMDP(BiomedicalPrograms,生物医学程序)并称为国际上最有

Ξ收稿日期:2002-07-15

 作者简介:胡惮(1971-),男,湖北通城人,咸宁学院英语系讲师。

SPASS

90咸宁学院学报               第23卷

表1 测试试卷试题结构

PART12345

ITEMTYPEListeningComprehensionReadingComprehensionVocabularyandStructure

ClozeTestWriting

NUMBEROFITEMS

202030201

SCOREDISTRIBUTION

20%40%15%10%15%

二、数据分析

为了尽量排除阅卷过程中主观因素对统计结果的干扰,我们将主观性较大的作文部分作为控制变量,将部分

的分数从总分中扣除。这样我们就得到了如下的原始分数表:

表2 两次测试原始分数

STUDENTNO1970312501970312502970312503970312504970312505970312506970312507970312508970312509970312510970312511970312512

TEST14215414626152326154315631541154432153615

TEST25649591530381545154752155748344815

STUDENTNO1970312513970312514970312515970312516970312517970312518970312519970312520970312521970312522970312523970312524

TEST14135153336431545251559153215475128

TEST25415441539484553153215584867155441

STUDENTNO1970312525970312526970312527970312528970312529970312530970312531970312532970312533970312534970312535970312536

TEST14815541545153615581564534442561544157515

TEST252671558457415661557575715611540155515

启动SPSS,新建一张工作表,将以上数据依次录入,并校对无误后,即可进行分析。首先可以获得常规的描述

性统计数据。从SPSS的菜单中选择Statistics#Summarize##Descriptives计算机立即给出如下数据:

表3 统计结果描述Ξ

Test1Test2

3636

75157415

2330

5215044150

261548

431552125

43154175112083

11191121011738

14118771031505

当然,如果没有SPSS,我们也可以通过手工计算逐项得到这些结果,计算公式为:Range:R=Maximum-Mini2

Ξ统计术语说明:MAXIMUM;最大值;MINIMUM;最小值;RANGE:全距;MODE:众数;MEDIAN:中值;MEAN:平均值;S.D.

(STANDARDDEVIATION)标准差;VARIANCE:方差。

 统计术语说明:F(Frequency):频数 P:(Percent):各组频数占总例数的百分比  V.P.(ValidPercent):各组频数占总例数的

有效百分比  C.V.(CumulativePercent):各组频数占总例数的累计百分比

SPASS

第1期       胡 惮 如何用统计软件SPSS进行英语测试分析

mum

Mean:X=

Valid

3

91

3

3

3

ΣN

FPV1PPP

StandardDeviation:S.D.=Variance:V=S.D.2

2

N-1

4510045150471004810048150491005210052150

C1P321851611111319191422122510271833133819411744144712521858136111631966176914721275107718801683138611881991179414971210010

21131111111113121112136

51621821881321821821821821821821821821881321851621821821851621810010

51621821881321821821821821821821821821881321851621821821851621810010

2718301633134117441447125010521855165813611163196617751077188313861188199117971210010

继续运行SPSS,从菜单中选择Statistics#Summarize##Frequencies,我们可以得到这两次测试的频数表:

表4 测试一频数表

Valid23100

2515026150281003215033100351503610036150411004115042100421504315044100441504510045150461004710048150511005310054150561505815059150631506410075150F31

12121112211122111111111111111P3218218516218516218218218516516218218218516516218218218218218218218218218218218218218218218V1P321821851621851621821821851651621821821851651621821821821821821821821821821821821821821821853150541005415055150561005710057150581005915061150661506715074150Total

接下来我们可以作出这两次测试的成绩分布柱状图。从SPSS菜单中选择Statistics#Summarize##Frequencies###Charts###Histogram(withnormalCurve),计算机立即绘出如下带有理想正态分布曲线的柱状统计图:

表5 测试二频数表

Valid301003215034100381503910040150411003

F

3

P

3

V1P

3

PP

1111111218218218218218218218218218218218218218218218

5168131111131916171914以上两图中的曲线,两条虚拟的正态分布曲线,它们是电脑根据这两次测试的平均值和标准差计算出来的最理

SPASS

92咸宁学院学报               第23卷

生个体两次测试成绩的关系。从SPSS菜单中选取Graph#

Scatter##Simple,将测试一放在坐标轴X上,测试二放在

想的成绩分布状态。从图上可以看出,实际的成绩分布柱状图和正态分布曲线有很大的差距。那么,我们的测试实际的分布曲线(curve)又是怎样的呢?我们可以用Mi2

crosoftExcelTM来作进一步的分析。将数据输入EXCEL后,

坐标轴Y上,可得如下散点图:

可以得到如下分布曲线:

现在我们再来分析一下这两次测试之间的相关性。我们可以找出它们之间的两种关系:两次测试的整体相关系数和每个学生个体在两次测试中的成绩之间的关系。我们采用在教育统计学中应用广泛的积差相关系数,即皮尔森

(Pearson)相关系数,双尾(two-tailed)检测[6]。从SPSS

菜单中选择Statistics#Correlate##Bivariate###Pearson

(twotailed),计算机给出如下的相关系数表

:

三、数据处理结果讨论

至此我们已经获得了大量的分析数据和图表。对这些数据和图表,我们可以根据统计学的基本原理,进一步作出如下解释:

11因为用于分析试卷卷面总分为85分(去掉15分的

作文分作为控制变量),基本的及格分数应为51分(85分×60%=51分)。由表3可以看出,测试一的平均分

(MEAN)为4315,远远在及格线以下。由表4可以看出,

测试一在51分及格线的累计频数为(C.V.)7718,这表明有7718%的学生不能及格。再看表3,测试一的标准差

(S.D.)和全距(RANGE)分别高达12和5215,这就表

明这次测试的区分度非常大。我们知道,大学英语四级考试是一种成绩测试,其设计的试题区分度一般较小。这个结果说明被试班的学生个体之间可能存在太大的差异。

21测试二的情况有所改观。平均分提高到52,刚好

表6 两次测试相关系数表

TEST1

Text1

PearsonCorrelationSig.(2-tailed

N

Test2

PearsonCorrelationSig.(2-tailed)

N

11000.360.7293.00036

TEST2017293.000361.000.36

在及格线以上。及格线的累计频数降低到了50,这表明仍有一半的学生不能及格。而且标准差和全距还是很高,分别为10和4415。这就映证了我们上面的分析:被试班个体差异太大。这种状况不利于合理安排教学。我们可以考虑分班教学或给弱一点的学生适当调整一下教学内容或补课。

31从图1和图2可以直观地看出两次测试的成绩分布

离理想的正态分布相去甚远。图3和图4进一步表明了这种差异的意义:图3的曲线看起来很漂亮,两边对称,几乎象一个钟形(正态曲线的标准形状)。但是这显然不是正态曲线。它的坡度太陡,峰值很高。这表明峰值附近的分数分布过于密集。而这个峰位于4015-5015的分数段内,在及格线以下。然而我们还要看到事物的另一面,那就是这个峰虽然在及格线以下,却非常靠近及格线。这说明有一大部分的学生已经非常接近及格线,只要他们再多加一把劲,通过及格线是不成问题的。图4证明了我们的推测。图4中的峰移到了右边,在及格线以上,整个曲线呈负偏态分布。这意味着高分段的学生比例比较高了。我们还看到了紧邻及格线左边的区间分布密集,曲线呈高

3 Corrlationissignificantatthe0.01level(2-tailed)

从表中可以看出:两次测试的整体上在0.01的水平上显著相关,相关系数达到0.729。当然,

这个数据也可以通过如下的公式手工计算获得:

相关系数R=

[N∑x2-

(∑Y)2]

(∑X)2][N∑Y2-

我们再来作出两次测试的散点图以进一步考察每个学

SPASS

第1期       胡 惮 如何用统计软件SPSS进行英语测试分析

原状;从及格线到峰值点坡度徐缓上升。这个结果就更令人鼓舞了。因为这说明原来临近及格的一部分学生通过努力已经达到了自己的目的,而更多的学生还正在越来越靠近及格线。我们高兴地看到,在师生的共同努力下,这两次测试中间一个多月的时间的教学还是卓有成效的。结合上文第2点的讨论,如果我们对部分成绩稍差的学生采取适当的教学强化措施,该班必然能在最后的真正的四级考试中取得令人满意的整体成绩。

41从图5中我们看到了另外一个好消息。除了极个别

93

因为两次测试题目都是真实的四级考试原题,所以从理论上讲它们必然具有极高的相关性。分析的结果正是我们所期望的理想值,这证明了我们所采样的数据是可信的。

四、结语

语言测试分析涉及到的内容纷繁复杂,一方面是对学生的知识和技能进行评价,另一方面是对试题和试卷本身的科学性,如信度、效度、难度和区分度等指标进行评价。而且后者往往是前者的前提和基础,即只有科学合理的试题,才能保证学生成绩的真实性合理性。本文的研究思路也正是基于这样的前提。在实际的教学过程之中情况往往要复杂些,需要分析的参数要更多一些。所以本文不能概括语言测试分析中的所有问题,只是管窥了教育统计学在测试分析应用中之一斑,希望籍此探讨一种收集处理测试反馈信息,并用以指导后续教学的方法。参考书目:

[1]周凤岗.考试本是教育资源,绝非仅是测评手段

[J].教育与现代化,2002,(2):81

[2]谢浩,刘晓帆1努力发挥考试在素质教育中的作用

[J]1武汉水利电力大学学报(社会科学版),1999,19(5):551

[3]阎俊宇1谈外语教学与测试的关系[J]1河南教育学

的例子外,几乎所有的点都集中在一条斜线附近,表明两次测试成绩呈正相关:第一次考得好的同学,第二次表现也不错。这个结果说明了这个班的学生学习状态稳定,成绩稳步上升。结合在第二次测试中所取得的实际进步,我们有理由相信这个班在今后的教学中不会令我们失望。

51皮尔森系数是一个范围在-110到110之间(包括-1.0和1.0在内)的无量纲指数,反映了两个数据集

合之间的线性相关程度[6]。从表7中看出,两次测试的皮尔森相关系数达到01729,说明两次测试高度相关。我们可以计算出它们之间的变化交叠(VARIANCEOVERLAP),即相关系数的平方,R2=017292=0153并图示如下

:

院学报(哲学社会科学版),1999,(2):1031

[4]统计分析利器SPSS[DB/OL].http://www.1drug.

net/soft/spss.htm,2002-07-061

[5]SPSS介绍[DB/OL]./

Products/spss.htm,2002-07-061

[6]甘雨.用EXCEL函数做教育统计[DB/OL].2002-07-07

HowtoAnalyzeanEnglishTestingwithSPSS

HUDan

(DepartmentofEnglish,XianningCollege,Xianning437005,China)

Abstract:Testingisaveryimportantcomponentinlanguageteaching.Itisthechiefmeasuresofevaluatingandac2celeratingteaching.Theresultoftestingcanprovidefeedbackwhichwillhelptheteachersfindouttheirstudents’limitationinstudyandguidetheteachingreformation.However,itdemandsascientifictoolandmethodtoanalyzethetestingresult.Thisessaytakesagroupofrealtestingdataasexample,discusseshowtousethefamousStatisticalPackagefortheSocialScience(SPSS)toanalyzetheoriginaltestingdata,andthusprovidesguidingfeedbackforfurtherteaching.

Keywords:LanguageTesting;Statistics;SPSS

本文来源:https://www.bwwdw.com/article/mi2m.html

Top