学年成绩分析 - 图文

更新时间:2024-06-09 00:31:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

湖南工业大学

课 程 设 计

资 料 袋

学院(系、部) 2012-2013 学年第 1 学期 课程名称 数据分析 指导教师 职称 学生姓名 ake555 专业班级 学号

题 目 对2011-2012学年成绩分析

成 绩 起止日期 2012 年 12月 31 日 ~ 2013 年 01 月 07 日

目 录 清 单

序号 1 2 3 4 5 6

材 料 名 称 课程设计任务书 课程设计说明书 附件:课程设计主要模块实现代码 资料数量 1 1 1 备 注 张 1

湖南工业大学

课程设计任务书

2010 —2011 学年第2学期

学院(系、部) 专业 班

课程名称: 数据分析 设计题目: 2011-2012学年成绩分析

完成期限:自 2012 年 12 月 31 日至 2013 年 01月 07 日共 1 周

任 务 及 内 容 进 度 安 排 设计的任务:1.掌握R软件的相关知识 2.熟练掌握相关R语句的编辑和运用; 内容包括:求均值、方差、作主成份分析等等 起止日期 2012.12.31~2013.01.01 2013.01.02~2013.01.03 2013.01.04~2013.01.05 2013.01.06 2013.01.07 查找资料并分析 工作内容 设计结构,实现相关算法 运行调试相关程序 整理所设计系统的相关资料 完成课程设计报告 主 要 参 考 资 料 1]薛毅、陈立萍等编著。统计建模与R软件。北京:清华大学出版社,2007.4 [2]蔡乐主译。用R软件和Epical程序包分析流行病学数据。人民卫生出版社,2008.07.01 [3]周庭悦编著。市场调研:应用R软件。中国人民大学出版社,2012.10.01 指导教师(签字): 年 月 日 系(教研室)主任(签字): 年 月 日

2

数据分析

设计说明书

数据分析

对2011-2012学年成绩分析

起止日期: 2012 年 12 月 31 日 至 2013 年 01 月 06 日

学班学成

生姓名 级 号 绩

ake555

指导教师(签字)

2013 年 01月06 日

1

目 录

第一章 概述 ................................................... 1

1.1课题分析 ..................................................... 1 1.2设计内容 ..................................................... 1

第二章 需求分析

2.1 课程任务........................................ 2 2.2 运行环境.........................................2

第三章 用R软件对班级成绩进行操作 ................ 2

3.1 引用班级成绩数据 ..................................... 2

3.2 对班级成绩数据进行标准化...........................2

3.3主成分分析.........................................2 3.4对班级成绩进行求方差求相关矩阵.....................2

第四章 用R软件绘图 ........................ 错误!未定义书签。

4.1 对任意俩科成绩绘图 ............... 错误!未定义书签。

总结 参考文献

\\

第一章 概述

2

1.1 课题分析

在大学里学生的生活虽然日趋多样化,但是对于成绩的评估还是重

中之重,如何做好对一个班级的全面评估,这是一个值得讨论的问题。在这里我们引入一款新的软件,那就是R软件,对实际的问题进行主成分分析时,往往是要借助计算机软件来完成的,比较常用的是 SPSS 软件,但是这个软件是收费的。 而相比之下,最近几年发展很快的 R 软件也是一款功能强大的统计软件包,R 软件[是属于 GNU 系统的一个自由、免费、源代码开放的软件。 随着我国对于软件知识产权法规不断完善的情况下,学习、利用和基于 R 软件平台进行二次开发对于我国的科研人员来说越来越重要,同时也具有重大的现实意义基于历年成绩表对学生成绩预测, 在已有的学生成绩评价体系中,运用R软件中模型方法对学生成绩进行科学合理符合实际的评价,有广泛的应用价值。

影响学生成绩变化因素很多,对个人来说其成绩具有随机性,利用R软件,成绩变动模型和标准分数模型有利于全面、客观、合理的评价学生的学习状况,有利于教学部门更好的掌握学生的学习情况和今后的发展趋势。 对教学部门掌握教风、学风,特别是每个生的进步情况有很大帮助,有广泛的应用价值。 为了更加科学合理的解决学生学该成果对学生的学习状况的评价具有一定的参考价值和指导意义。

1.2 设计内容

本课题主要解决对学生成绩总体的客观评价,通过一系列数据的分析比较,例如平均值,成绩分布等整体数据的处理,以及R软件在数据联动功能方面的应用,所绘制的直方图、正态分布图等图像信息

3

使得分析成绩系统更直观、有效地反映学生此课程这一阶段的表现,进而研究今后的教学重点,以及从教学到考试等一连串过程中的薄弱环节,从而达到教学相长的目的。

不论是对学生的整体学习情况还是单独考虑每个学生的学习情况都能够进行较好的评价。比起单纯的\绝对分数\评价学生的学习状况,忽略了基础条件的差异,我们运用了各种方法和模型来去避免这类现象的发生,动态的分析每个学生的情况,并从定性和定量两方面分别给出了数值与建议。

第二章 需求分析

2.1课程任务

本次课程需要用R软件完成对班级各科成绩的评测,内容包括对数据进行标准化、求平均值、方差、协方差、协方差矩阵,进行简单的画图(包括散点图,直方图,正态分布图),实验报告,总结,其目的主要是熟悉R软件的使用。 2.2运行环境

运行环境主要是R软件,辅助软件有word\\excel等

第三章 用R软件对班级成绩进行操作

3.1引用班级成绩数据

用R软件对班级成绩进行分析,首先要对班级成绩进行应用,如果进行纯手工输入会造成工作量过大,并且有可能会有数据错误或者缺失等不利之处,在这里 我们需要用到简单的R程序(读取外部数据)如下:

4

d=read.csv(\位置\d

(既先将需要调用的外部数据另存为csv或txt格式,然后记住位置使用以上函数进行引入)

结果如下:

部分数据

3.2.对班级数据进行标准化

为了下面实现 R 软件应用于主成分分析中的,现以研究我国 2008 各地区城镇居民家庭平均每人全年的消费情况为例。 首先收集能反映我们班成绩及排名情况的名称和数据, 这八个方面来描述学生成绩情况。收集到的数据于在上面,为有利于后面操作,及我们对我班成绩进行直观的认识, 需要将班级成绩数据进行标准化,在其命令行中输入下面的命令:

d=read.csv(\从存储位置读取数据 > sd=scale(d) # 对数据进行标准化

5

> sd #输出标准化后的数据和属性信息 结果如下:

6

标准化后的部分数据

数据属性

3.3.主成分分析

在分析现实的问题时,往往会涉及到很多的指标,这些指标如果都要考虑的话,会很复杂。 主成分分析方法通过降维的思想,在损失很少信息的情况下把多个指标综合成少数几个具有代表性的指标,通常把这些具有代表性的指标称为主成分。

对实际的问题进行主成分分析时,往往是要借助计算机软件来完成的,比较常用的是 SPSS 软件,但是这个软件是收费的。 而相比之下,最近几年发展很快的 R 软件也是一款功能强大的统计软件包,R 软件[2]是属于 GNU 系统的一个自由、免费、源代码开放的软件。 随着我国对于软件知识产权法规不断完善的情况下,学习、利用和基于 R 软件平台进行二次开发对于我国的科研人员来说越来越重要,同时也具有重大的现实意义。 2 主成分分析基本原理

设对于某个问题的研究涉及到 p 个指标,分别用 X1,X2,X3…XP 表示,这 个指标构成的 p 维随机向量设为 ,对X 进行线性变换,可以通过线性组合的方式形成新的综合变量,这里用 C 表示。 新的综合变量和原来变量之间的关系可以用下面的公式表示:

上式中的线性组合可以是任意的,由不同的线性变换得到的综合变量 的统计特征也是不一样的。 为了使综合变量可以较好的描述原变量的特征,应该要让 的方差尽可能的大,并且 Ci 之间相互独立。

3.4对班级成绩进行求方差和相关矩阵 1、提出猜想:

7

> x<-read.table(\ &&读取数据 > for(i in 1:5){cat(var(x[,i]))} &&各变量的方差 输出变量:

600.387251.73782148.2147151.0199302.9737>

上图看到变量3、变量4的方差较大,于是猜想:如果变量方差大并且变量所在的第一、第二主成分系数也大,那么变量的方差对班级成绩描述的贡献可能也大。 2、验证

> a<-cor(x) &&求相关矩阵(协方差)要求相关都为正

> eigen(a) &&输出特征值、特征向量 输出:

8

结果截图

第四章 用R软件绘图

4.1对随机抽取的同学成绩绘图

9

4.1.1为了对全班在单科的成绩上有充分认识我们往往通过用R软件对一科或者俩科进行画图处理,通过对全班俩科成绩做散点图我们可以清楚的知道俩科成绩的联系:

例如对概率论与数理统计和普通物理学1绘散点图: R程序

d=read.txt(\位置 d #输入 Plot(dxyv4,v5)

讨论:通过对散点图的观察有利于我们对俩们课的内在联系有一个初步理解,便于对课程的安排提出建议。 4.1.2

9、大学英语3成绩分布直方图和正态分布的概率密度曲线

10

程序:plot(ecdf(dxyv3),verticals=TRUE,do.p=FALSE)

X<-0:100

lines(X,pnorm(X,mean(dxyv3),sd(dxyv3)))

总 结

通过本次课程设计,我学到了不少,体会到了从迷茫到理清眉

目到找资料到埋头苦干到收获成绩,这其中充满酸甜苦辣,R程序确实是一个实用性很强的程序,在生活中也有很多应用,R软件是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统、数组运算工具、完整连贯的统计分析工具、优秀的统计制图功能。绩分析模块、分析结果评价模块等。通过对学生成绩的分析,对学生学习态度、认知能力、教师教学质量等各方面进行评价总结,进而为教学管理提供可靠的依据。

该课题不仅解决了一项实际问题,同时也提供了解决一般问题的基本思路。首先对于信息的收集及导入,然后根据信息分析所需,其

11

次分析研究内容的可靠性,最后得出结论。应用学生成绩分析系统,可以大大提高工作效率,减少成绩评判的误差同时我们也意识到,评价结果只代表评价对象目前的个人情况,在学生学习状况评价时,通过考试或其他评价手段所获得的评价结果,只表明学生目前在某一方面学会的行为或之前所处的位置,代表他们学会了做什么、怎么思考同题和表达思想,评定成绩表明的是学生目前的表现,它不能代表过去也不能预示将来。因为学生的发展是一个动态起伏的过程,而不是一个线性过程。而且学生可能在某一方面成绩不理想,但在其他方面却有出色的表现。评价结果并不一定就是评价对象真实水平的表现,只是对其表现的一种估计。

总的来说,这次设计对于我有很多积极的意义的,不仅让我们认识并熟悉了一种新的软件,也让我们充满了自信息,作为应用数学的学习者,信心和兴趣最重要,感谢老师给我们这次机会。

参 考 文 献

1]薛毅、陈立萍等编著。统计建模与R软件。北京:清华大学出版社,2007.4

[2]蔡乐主译。用R软件和Epical程序包分析流行病学数据。人民卫生出版社,2008.07.01

[3]周庭悦编著。市场调研:应用R软件。中国人民大学出版社,2012.10.01

12

本文来源:https://www.bwwdw.com/article/8fx6.html

Top