R语言做判别分析
“R语言做判别分析”相关的资料有哪些?“R语言做判别分析”相关的范文有哪些?怎么写?下面是小编为您精心整理的“R语言做判别分析”相关范文大全或资料大全,欢迎大家分享。
R软件做判别分析
R 软件做判别分析: 1. 距离判别 (1) 两样本
discriminiant.distance <- function(TrnX1, TrnX2, TstX = NULL, var.equal = FALSE) {
if (is.null(TstX) == TRUE) TstX <- rbind(TrnX1,TrnX2) if (is.vector(TstX) == TRUE) TstX <- t(as.matrix(TstX)) else if (is.matrix(TstX) != TRUE) TstX <- as.matrix(TstX)
if (is.matrix(TrnX1) != TRUE) TrnX1 <- as.matrix(TrnX1) if (is.matrix(TrnX2) != TRUE) TrnX2 <- as.matrix(TrnX2) nx <- nrow(TstX)
blong <- matrix(rep(0, nx), nrow=1, byrow=TRUE, dimnames=list(\
mu1 <- colMeans(TrnX1); mu2 <- colMeans(TrnX2) if (var.equal == TRUE || var.equal == T){ S <- var(rbind(TrnX1,TrnX2))
w <- mahalanobis(TstX, mu2, S)- mahalanobis(TstX, mu1, S) } else{
S1 <-var(TrnX1); S2 <- var(TrnX2)
w <- mahalanobis(TstX, mu2, S2)- mahalanobis(TstX, mu1, S1) }
for (i in 1:nx){
if (w[i] > 0) blong[i] <- 1 else
blong[i] <- 2 } blong }
例1: 数据
classX1<-data.frame(
x1=c(6.60, 6.60, 6.10, 6.10, 8.40, 7.2, 8.40, 7.50, 7.50, 8.30, 7.80, 7.80),
x2=c(39.00,39.00, 47.00, 47.00, 32.00, 6.0, 113.00, 52.00, 52.00,113.00,172.00,172.00),
x3=c(1.00, 1.00, 1.00, 1.00, 2.00, 1.0, 3.50, 1.00, 3.50, 0.00, 1.00, 1.50),
x4=c(6.00, 6.00, 6.00, 6.00, 7.50, 7.0, 6.00, 6.00, 7.50, 7.50, 3.50, 3.00),
x5=c(6.00, 1
R语言判别分析实验报告
R语言判别分析实验报告
班级:应数1201 学号:12404108 姓名:麦琼辉
时间:2014年11月28号
1 实验目的及要求
1) 了解判别分析的目的和意义;
2) 熟悉R语言中有关判别分析的算法基础。
2 实验设备(环境)及要求
个人计算机一台,装有R语言以及RStudio并且带有MASS包。
3 实验内容
企业财务状况的判别分析
4 实验主要步骤
1) 数据管理:实验对21个破产的企业收集它们在前两年的财务数据,对25个
财务良好的企业也收集同一时期的数据。数据涉及四个变量:CF_TD(现金/总债务);NI_TA(净收入/总资产);CA_CL(流动资产/流动债务);CA_NS(流动资产/净销售额),一个分组变量:企业现状(1:非破产企业,2:破产企业)。
2) 调入数据:对数据复制,然后在RStudio编辑器中执行如下命令。
case5=read.table(‘clipboard’,head=T) head(case5)
3) Fisher判别效果(等方差,线性判别lda):采用Bayes方式,即先验概率
为样本例数,相关的RStudio程序命令如下所示。
library(MASS)
ld=lda(G~.,data=case5);ld
R语言中的多元统计之判别分析
前言
判别分析(discriminant analysis)是多元统计分析中较为成熟的一种分类方法,它的核心思想是“分类与判断”,即根据已知类别的样本所提供的信息,总结出分类的规律性,并建立好判别公式和判别准则,在此基础上,新的样本点将按照此准则判断其所属类型。例如,根据一年甚至更长时间的每天的湿度差及压差,我们可以建立一个用于判别是否会下雨的模型,当我们获取到某一天(建立模型以外的数据)的湿度差及压差后,使用已建立好的模型,就可以得出这一天是否会下雨的判断。 根据判别的组数来区分,判别分析可以分为两组判别和多组判别。接下来,我们将学习三种常见的判别分析方法,分别是:
?
距离判别 Bayes判别 Fisher判别
?
?
一、距离判别基本理论
假设存在两个总体本到两个总体的距离样本属于总体
和
,另有为一个维的样本值,计算得到该样和
,如果
;若
大于
等于
,则认为
,
,反之样本则属于总体
则该样本待判。这就是距离判别法的基本思想。
在距离判别法中,最核心的问题在于距离的计算,一般情况下我们最常用的是欧式距离,但由于该方法在计算多个总体之间的距离时并不考虑方差的影响,而马氏距离不受指标量纲及指标间相关性的影响,弥补了欧式距离在这方面的缺点,其计算公式如下
判别分析实验报告
spss实验报告
实验报告
经济贸易 系 统计学 专业 12 级 统计学本科 班 实验人: 实验地点: 实训楼B301 实验日期: 2015.3.25
实验题目:判别分析法的应用
实验目的:用SPSS软件实现判别分析及其应用
实验内容:用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数
并判定青海、湖北、山东、陕西四个地区的归属类别
实验步骤与实验结果:
表2 组均值的均等性的检验
出生预期寿命(年) 成人识字率(%) 人均GDP(元)
Wilks 的 Lambda
F df1
df2
Sig.
spss实验报告
表2是对各组均值是否相等的检验,由该表可以看出,在0.1的显著性上我们不能拒绝成人识字率在两组的均值相等的假设,其余两个标准出生预期寿命以及人均GDP在两组的均值是有显著差异的。
表3 对数行列式 分组 1 2
汇聚的组内
秩
对数行列式
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
表4 检验结果 箱的 M F
近似。 df1 df2 Sig.
对相等总体协方差矩阵的零假设进行检验
聚类分析及判别分析案例
一、 案例背景
随着现代人力资源管理理论的迅速发展,绩效考评技术水平也在不断提高。绩效的多因性、多维性,要求对绩效实施多标准大样本科学有效的评价。对企业来说,对上千人进行多达50~60个标准的考核是很常见的现象。但是,目前多标准大样本大型企业绩效考评 问题仍然困扰着许多人力资源管理从业人员。为此,有必要将当今国际上最流行的视窗统计软件SPSS应用于绩效考评之中。
在分析企业员工绩效水平时, 由于员工绩效水平的指标很多,各指标之间还有一定的关联性,缺乏有效的方法进行比较。目前较理想的方法是非参数统计方法。本文将列举某企业的具体情况确定适当的考核标准,采用主成分分析以及聚类分析方法,比较出各员工绩效水平,从而为企业绩效管理提供一定的科学依据。
最后采用判别分析建立判别函数,同时与原分类进行比较。
聚类分析
二、绩效考评的模型建立
1、为了分析某企业绩效水平,按照综合性、可比性、实用性和易操作性的选取指标原则,本文选择了影响某企业绩效水平的成果、行为、态度等6个经济指标(见表1)。
2、对某企业,搜集整理了28名员工2009年第1季度的数据资料。构建1个28×6维的矩阵(见表2)。
3、应用SPSS数据统计分析系统首先对变量进行及主成分分析,找到样本的主
判别分析实验报告
spss实验报告
实验报告
经济贸易 系 统计学 专业 12 级 统计学本科 班 实验人: 实验地点: 实训楼B301 实验日期: 2015.3.25
实验题目:判别分析法的应用
实验目的:用SPSS软件实现判别分析及其应用
实验内容:用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数
并判定青海、湖北、山东、陕西四个地区的归属类别
实验步骤与实验结果:
表2 组均值的均等性的检验
出生预期寿命(年) 成人识字率(%) 人均GDP(元)
Wilks 的 Lambda
F df1
df2
Sig.
spss实验报告
表2是对各组均值是否相等的检验,由该表可以看出,在0.1的显著性上我们不能拒绝成人识字率在两组的均值相等的假设,其余两个标准出生预期寿命以及人均GDP在两组的均值是有显著差异的。
表3 对数行列式 分组 1 2
汇聚的组内
秩
对数行列式
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
表4 检验结果 箱的 M F
近似。 df1 df2 Sig.
对相等总体协方差矩阵的零假设进行检验
判别分析实验报告
数学实验报告 判别分析
一、实验目的
要求熟练掌握运用SPSS软件实现判别分析。
二、实验内容
已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为
第一个样品:
x1??8,x2??14,x3?16,x4?56
第二个样品:
x1?92,x2??17,x3?18,x4?3.0
运用SPSS软件对实验数据进行分析并判断两个样品的分组。
三、实验步骤及结论
1.SPSS数据分析软件中打开实验数据,并将两个待检验样本键入,作为样本18和样本19。
2.实验分析步骤为:
分析→分类→判别分析
3.得到实验结果如下:
(1) 由表1,对相等总体协方差矩阵的零假设进行检验,Sig值为0.022<0.05,则拒绝原假设,则各分类间协方差矩阵相等。
表1 协方差阵的均等性函数检验结果表 检验结果a 箱的 M F 近似。 df1 df2 Sig. 35.960 2.108 10 537.746 .022 由表2可得,函数1所对应的特征值贡献率已达到99.6%,说明样本数据均向此方向投影就可得到效果很高的分类,故只取函数1作为投影函数,舍去函数2不做分析。
表3为典型判别式函数的Wilks的Lambda检验,此检验中函数1的Wilks Lambda检验si
第五章 判别分析
应用多元统计分析
第五章 判 别 分 析
目 录
§5.1 距离判别
§5.2 Bayes(贝叶斯)判别法及
广义平方距离判别法 §5.3 Fisher(费歇)判别
什么是判别分析:
判别分析是用于判断样品所属类型的一种统计分析方法.
在生产、科研和日常生活中经常遇到如何根据观测到的数据资
料对所研究的对象进行判别归类的问题. 例如:在医学诊断中,一个病人肺部有阴影,医生要判断他是肺结核、肺部良性肿瘤还是肺癌.这里肺结核病人、良性瘤病人、肺癌病人组成三个总体,病人来源于这三个总体之一,判别分析的目的是通过测得病人的指标(阴影的大小,边缘是否光滑,体温多少……)来判断他应该属哪个总体(即判断他生什么病).
在气象学中,由气象资料判断明天是阴天还是晴天, 是有雨还是无雨.
在市场预测中,由调查资料判断下季度(或下个月)产品是畅销、平常或滞销. 股票持有者根据某种股票近期的变化情况判断此种股票价格下一周是上升还是下跌.在环境科学中,由气象条件,污染浓度等判断该地区是属严重污染,一般污染还是无污染.
在地质勘探中,由岩石标本的多种特征判断地层的地质年代,是有矿还是无矿,是富矿还是贫矿.
判别分析-四种方法
第六章 判别分析
§6.1 什么是判别分析
判别分析是判别样品所属类型的一种统计方法,其应用之广可与回归分析媲美。 在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。例如在经济学中,根据人均国民收入、人均工农业产值、人均消费水平等多种指标来判定一个国家的经济发展程度所属类型;在市场预测中,根据以往调查所得的种种指标,判别下季度产品是畅销、平常或滞销;在地质勘探中,根据岩石标本的多种特性来判别地层的地质年代,由采样分析出的多种成份来判别此地是有矿或无矿,是铜矿或铁矿等;在油田开发中,根据钻井的电测或化验数据,判别是否遇到油层、水层、干层或油水混合层;在农林害虫预报中,根据以往的虫情、多种气象因子来判别一个月后的虫情是大发生、中发生或正常; 在体育运动中,判别某游泳运动员的“苗子”是适合练蛙泳、仰泳、还是自由泳等;在医疗诊断中,根据某人多种体验指标(如体温、血压、白血球等)来判别此人是有病还是无病。总之,在实际问题中需要判别的问题几乎到处可见。
判别分析与聚类分析不同。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判
高级统计学-判别分析作业
全国各地区消费水平的实例判别分析
摘要:针对我国各省(直辖)市的2009年度消费水平数据,选取9个经济指标进行
系统聚类分析,得到我国3类不同的地区消费水平类型;利用实例进行判别分析, 结合实际情况分析结果。聚类结果为制订有针对性的地区消费市场战略提供依据。
关键词:SPSS;判别分析;消费水平。 1.引言
由于传统的经济发展起点不同,加上地域、资源、技术和政策等条件的差异,各个地区的经济发展水平高低不齐,导致各地区的工资水平和消费水平的不同。因此,对各地区消费水平进行分类、比较和研究,总结出有助于市场调节和商业发展的对策,有针对性地制订地区经济发展战略,对促进国民经济协调发展有重要意义。聚类分析和判别分析是是进行以上分析的两个重要的方法。
1.1判别分析
定义:判别分析是一种进行统计判别和分组的技术手段。根据一定量案例的一个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组。
判别分析的基本思想:对已知分类的数据建立由数值指标构成的分类规则即判别函数,然后把这样的规则应用到未知分类的样本去分类。
本文针对我国各省(直辖)市的2009年度