R语言实验指导书(二)
更新时间:2023-10-16 20:12:01 阅读量: 综合文库 文档下载
R语言实验指导书(二)
2016年10月27日
实验三 创建和使用R语言数据集
一、
1. 2. 3. 二、
1.
实验目的:
了解R语言中的数据结构。
熟练掌握他们的创建方法,和函数中一些参数的使用。
对创建的数据结构进行,排序、查找、删除等简单的操作。 实验内容:
向量的创建及因子的创建和查看
有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1 以 及他们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。
1) 将这些州名以字符串的形式保存在state当中。 2) 创建一个为这个向量创建一个因子statef。 3) 使用levels函数查看因子的水平。
2. 矩阵与数组。
i.
创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。
3. 将之前的state,数组,矩阵合在一起创建一个长度为3的列表。
4. 创建一个数据框如图。
5. 将这个数据框按照mpg列进行排序。
6. 访问数据框中drat列值为3.90的数据。
三、 实验要求
要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用。
实验四 数据的导入导出
一、
1. 2. 3. 二、
1. 2.
3. 4. 5. 6. 三、
实验目的
熟练掌握从一些包中读取数据。 熟练掌握csv文件的导入。
创建一个数据框,并导出为csv格式。 实验内容
创建一个csv文件(内容自定),并用readtable函数导入该文件。 查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。
列出airquality的前十列,并将这前十列保存到air中。 查看airquality中列的对象类型。 查看airquality数据集中各成分的名称 将air这个数据框导出为csv格式文件。(write.table (x, file =\=\) 实验要求
要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。
实验五 R语言数据的清洗
一、
1. 2. 3. 4. 二、
1.
实验目的
查看数据集的缺失值,并学会对缺失值进行处理。 对异常变量重新赋值。
将某一列的字符型转化为日期型。 利用subset()获取子集。 实验内容
有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。 Ozone <- c(41, 36, 12, 18, NA, 28)
Solar.R <- c(190, 118, 149, 313, NA, NA) wind <- c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9) Temp <- c(67, 82, 74, 62, 86, 66)
date <- c(\\
air <- data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFactors = FALSE)
使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/年。
使用subset()根据Temp列获取air中Temp大于60小于70的数据。 将air中含有缺失值的列去掉。
找出Temp中大于85的值将其设置为缺失值。
创建一个air1包含两个列q1,q2。用cbind函数添加到air中。 使用names函数查看air的列名,并根据列自己创建一个数据框。使用rbind函数添加到air中 实验要求
2. 3. 4. 5. 6. 7. 三、
要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。
实验六 高级数据管理
一、
1. 2. 二、
1.
实验目的
学会简单的数值和字符处理函数。 学会自己编写一个函数。 实验内容
使用下面代码创建roster数据集。
Student <- c(\
\ \
\ \
Math <- c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522) Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86) English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18) roster <- data.frame(Student, Math, Science, English,
stringsAsFactors=FALSE)
2. 使用length函数查看Student的长度。 3. 计算该班级数学的平均成绩,最高成绩。
4. 将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成
绩衡量指标、基于相对名次(前 20%,下20%,等等)给出从A到F的评分。 1) 使用quantile函数按20%,40%,60%,80%,求分位数。 2) 使用变量重命名的方法将grade列分为A、B、C、D、F几个等
级。 3) 使用strsplit 函数将Student列的名字分割,存到name中。 4) 创建一个函数x1,功能为实现返回值为传入参数的第一个值。 5) 使用sapply 函数将name中的firstname提取出来。(“sap
ply(data,function)”)同理即可提取出lastname。 6) 将lastname和firstname与roster合并,同时去掉roster
的第一列。 7) 将成绩单用姓和名进行排序。
三、 实验要求
要求学生学会一些简单的数值和字符处理函数。学会如何自己创建一个函数。和对一些简单问题的处理。
实验七 基本统计分析实验
一、
1. 2. 3. 4. 5. 6. 7. 二、
1.
实验目的
学会使用summary函数和Hmisc包中的describe函数来计算统计量。 使用table函数生成一维、二维、多维列联表。 学会用R实现卡方独立性检验。 学会用R进行相关性的度量。
学会用R进行Pearson、Spearman和Kendall相关。
学会用R进行相关性的显著性检验。 学会用R进行组间差异的非参数检验。 实验内容
描述性统计分析
1) 对R自带的数据集rock(48块石头的形态数据)使用summary函数、
Himisc包中的describe函数、pastecs包中的stats.desc函数计算描述性统计量。
2) 使用aggregate、doby中的summaryBy对sleep数据集的group列
分组获取描述性统计量。
2. 频数表和列联表
1) 加载vcd包中的Arthritis数据集使用table生成简单的频数统计
表。
2) 使用table、xtabs对Arthritis生成二维列联表。并使用addmargins
为这些表格添加边际和(根据Treatment、Improved)。 3) 使用xtabs,table生成三维列联表(根据Treatment、sex、Improved
三个因子)。
4) 使用chisq.testhan()函数对二维表的行和列进行卡方独立性检验,
并观察他们是否独立。
5) 使用vcd包中的assocstats()函数计算二维列联表的phi系数、列
联系数和Cramer’s V系数。 3. 相关
1) Pearson、Spearman和Kendall相关
a) 对state.x77数据集计算方差和协方差、Pearson积差相关系数、
Spearman等级相关系数。
b) 使用psych包中的corr.test对state.x77数据集Illiteracy、
Murder因子计算相关显著性检验
4. T检验
1) 比较了南方(group 1)和非南 方(group 0)各州的监禁概率(使
用MASS包中的t.test独立样本的t检验,So因子为是否为南方,Prob因子表示监禁率)。
5. 组间差异的非参数检验。
1) 使用Mann–Whitney U检验回答4中关于监禁率的问题,。
三、 实验要求
通过本次实验让学生学会基本统计分析用到的频数表、列联表、相关、t检验、组间差异的分参数检验。让学生可以掌握一些基本的统计分析的概念和如何用R来进行统计分析。
正在阅读:
R语言实验指导书(二)10-16
新标准大学英语视听说Unit 2 Mixed feelings文本材料09-02
混凝土抗压强度计算表(广东2013版)09-06
拱桥的拱箱吊装施工技术方案06-20
研究三维目标,优化物理教学12-18
《风险管理》总复习题(选择题)-重点10-25
7第七章 政府采购招投标制度08-17
B5U4学案定稿01-01
利润最大值模型01-20
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 指导书
- 语言
- 实验
- 水泥用凝灰岩项目可行性研究报告(发改立项备案+2013年最新案例范文)详细编制方案
- labview数据库
- 普通邮资明信片目录 PP1-PP216
- 行为金融导论
- 探讨室内空气污染物检测的必要性及综合治理办法-3000
- 快递企业分拨中心分拣作业管理与优化
- 毕业设计基于JSP的企业门户网站的设计与实现 - 图文
- 2018年北京市房山区中考英语一模试卷
- 俄罗斯住宅项目市场投资前景预测报告
- 231219 北交《基础工程》在线作业二 15秋答案
- 编制施工图预算注意事项说明
- 分组讨论提纲
- UNIX常用命令大全
- 翻译与文化
- 湖北省茶叶零售企业名录2018版1971家 - 图文
- 北京中医药大学远程教育《中药鉴定学Z》作业7答案
- 药剂学
- 宁波继续教育-《中华人民共和国招标投标法实施条例》解读
- 北京仁爱版初中英语八年级下册 Unit 6 Topic 1 课文翻译
- 2014最新版(人教版)六年级数学上册教案第五单元圆 - 图文