数理统计 作业四

更新时间:2024-06-18 06:52:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.用主成分分析方法探讨城市工业主体结构。表1是某市工业部门13个行业8项指标的数据。

表1 某市工业部门13个行业8项指标的数据 全员劳动年末固定工业总产职工人数 产率 资产净值 值 (人) (元/人(万元) (万元) 年) 1(冶金) 90342 52455 101091 19272 2(电力) 4903 1973 2035 10313 3(煤炭) 6735 21139 3767 1780 4(化学) 49454 36241 81557 22504 5(机械) 139190 203505 215898 10609 6(建材) 12215 16219 10351 6382 7(森工) 2372 6572 8103 12329 8(食品) 11062 23078 54935 23804 9(纺织) 17111 23907 52108 21796 10(缝纫) 1206 3930 6126 15586 11(皮革) 2150 5704 6200 10870 12(造纸) 5251 6155 10383 16875 13(文教艺术用14341 13203 19396 14691 品) 百元固定资金利税原资产值率 实现产值 (%) (元) 82.000 16.100 34.200 7.100 36.100 8.200 98.100 25.900 93.200 12.600 62.500 8.700 184.400 22.200 370.400 41.000 221.500 21.500 330.400 29.500 184.200 12.000 146.400 27.500 94.600 17.800 标准燃料消费量 (吨) 197435 592077 726396 348226 139572 145818 20921 65486 63806 1840 8913 78796 6354 能源利用效果 (万元/吨) 0.172 0.003 0.003 0.985 0.628 0.066 0.152 0.263 0.276 0.437 0.274 0.151 1.574 1)试用主成分分析方法确定8项指标的样本主成分(综合变量);若要求损失信息不超过15%,应取几个主成分;并对这几个主成分进行解释; 2)利用主成分得分对13个行业进行排序和分类。 解:先将给出的的数据导入到Spass软件

对导入的数据进行因子分析得到

KMO 與 Bartlett 檢定

Kaiser-Meyer-Olkin 測量取樣適當性。

Bartlett 的球形大約卡方 檢定

df 顯著性

.463 96.957

28 .000

首先进行KMO检验和巴特利球体检验,KMO检验系数=0.96957>0.5 P值<0.05,所以能进行因子分析。 起始特徵值 元件 1 2 3 4 5 6 7 8 總計 3.105 2.897 0.930 0.642 0.304 0.087 0.032 0.002 變異的 % 累加 % 說明的變異數總計 擷取平方和載入 總計 變異的 % 累加 % 循環平方和載入 總計 3.032 2.970 0.930 變異的 % 累加 % 38.811 38.811 3.105 38.811 38.811 36.218 75.029 2.897 36.218 75.029 0.930 11.628 86.657 11.628 86.657 8.027 94.684 3.801 98.485 1.082 99.567 0.402 99.969 0.031 100.000 擷取方法:主體元件分析。 37.903 37.903 37.127 75.029 11.628 86.657 循环平方和载入,累加达到85%,所以取三个指标,即累加达到86.657%

旋轉元件矩陣a 1 3 年末固定资产净值 .975 .108 职工人数 .965 .044 工业总产值 .989 .093 全员劳动产率 .121 .204 百元固定原资产值实-.169 .906 -.181 现产值 资金利税率 -.088 .931 .021 标准燃料消费量 -.020 -.700 -.289 能源利用效果 .141 .139 .961 擷取方法:主體元件分析。 轉軸方法:具有 Kaiser 正規化的最大變異法。 a. 在 4 疊代中收斂循環。 由旋转矩阵分析可知,八个指标分为三类

第一类:年末固定资产净值,职工人数,工业总产值

第二类:全员劳动产率,百元固定原资产值实现产值,资金利税率,标准燃料消费量

第三类:能源利用效果

元件 2 -.084 -.093 .090 .822

(2)对原始数据进行归一化处理,计算相应的得分,结果如下:

最后的结果如上表最后一列所示,根据数值的正负号分成两类,利用主成分得分对13个行业进行排序和分类如下:

第一类:1(冶金) 4(化学) 5(机械) 8(食品) 13(文教)

第二类:9(纺织) 6(建材)7(森工)10(缝纫)11(皮革)12(造纸)2(电力) 3(煤炭)

2.下表是某年美国50州每10万人中各种类型犯罪的犯罪率数据,分析找出主要的犯罪类型、列出主成分与原始变量的线性关系式,分析解释主成分及其特征,排序说明每州主要的犯罪类型。

州名 ALABAMA ALASKA ARIZONA ARKANSAS CALIFORNIA COLORADO CONNECTICUT DELAWARE FLORIDA GEORGIA HAWAII IDAHO ILLINOIS INDIANA IOWA KANSAS KENTUCKY LOUISIANA MAINE MARYLAND MASSACHUSETTS MICHIGAN MINNESOTA MISSISSIPPI MISSOURI MONTANA NEBRASKA NEVADA NEW HAMPSHIRE NEW JERSEY NEW MEXICO NEW YORK NORTH AROLINA NORTH DAKOTA OHIO OKLAHOMA OREGON PENNSYLVANIA RHODE ISLAND SOUTH CAROLINA SOUTH DAKOTA TENNESSEE TEXAS UTAH VERMONT VIRGINIA WASHINGTON WEST VIRGINIA WISCONSIN WYOMING 杀人罪 14.2 10.8 9.5 8.8 11.5 6.3 4.2 6 10.2 11.7 7.2 5.5 9.9 7.4 2.3 6.6 10.1 15.5 2.4 8 3.1 9.3 2.7 14.3 9.6 5.4 3.9 15.8 3.2 5.6 8.8 10.7 10.6 0.9 7.8 8.6 4.9 5.6 3.6 11.9 2 10.1 13.3 3.5 1.4 9 4.3 6 2.8 5.4 强奸罪 25.2 51.6 34.2 27.6 49.4 42 16.8 24.9 39.6 31.1 25.5 19.4 21.8 26.5 10.6 22 19.1 30.9 13.5 34.8 20.8 38.9 19.5 19.6 28.3 16.7 18.1 49.1 10.7 21 39.1 29.4 17 9 27.3 29.2 39.9 19 10.5 33 13.5 29.7 33.8 20.3 15.9 23.3 39.6 13.2 12.9 21.9 抢劫罪 96.8 96.8 138.2 83.2 287 170.7 129.5 157 187.9 140.5 128 39.6 211.3 123.2 41.2 100.7 81.1 142.9 38.7 292.1 169.1 261.9 85.9 65.7 189 39.2 64.7 323.1 23.2 180.4 109.6 472.6 61.3 13.3 190.5 73.8 124.1 130.3 86.5 105.9 17.9 145.8 152.4 68.8 30.8 92.1 106.2 42.2 52.2 39.7 斗殴罪 278.3 284 312.3 203.4 358 292.9 131.8 194.2 449.1 256.5 64.1 172.5 209 153.5 89.8 180.5 123.3 335.5 170 358.9 231.6 274.6 85.8 189.1 233.5 156.8 112.7 355 76 185.1 343.4 319.1 318.3 43.8 181.1 205 286.9 128 201 485.3 155.7 203.9 208.2 147.3 101.2 165.7 224.8 90.9 63.7 173.9 偷盗罪 3017.4 4701.5 6813.5 2834.7 5639.2 5838.4 3966.7 5361 5700.4 3521.3 5831.9 3650.4 3913.5 3584.9 3497.6 4009.7 2534.3 3635.4 3603.8 4577.7 3843.5 4681.7 3694 2155.5 3742.5 3578.1 3076.1 6665.7 3385.6 4210.3 4427.3 4510 3191.9 2289.1 3912.8 3516.3 5142.5 2501.6 4333.6 3956 2274.9 3036.2 4591.8 4176.2 3549.2 3507.4 4992.5 1939.1 3461.1 3583.8 汽车犯罪 280.7 753.3 439.5 183.4 663.5 477.1 593.2 467 351.4 297.9 489.4 237.6 528.6 377.4 219.9 244.3 245.4 337.7 246.9 428.5 1140.1 545.5 343.1 144.4 378.4 309.2 249.1 559.2 293.4 511.5 259.5 745.8 192.1 144.7 400.4 326.8 388.9 333.2 791.4 245.1 147.5 314 397.6 334.5 265.2 226.7 360.3 163.3 220.7 282

解:将上表中各项数据导入到SPSS,进行因子分析。

KMO检验和巴特利球体检验,KMO检验系数=0.763>0.5 P值<0.05,所以能进行因子分析。

a元件矩陣 1 3 杀人罪 .666 .279 强奸罪 .885 -.261 抢劫罪 .822 .369 斗殴罪 .833 -.079 偷盗罪 .764 -.471 汽车犯.580 .694 .290 罪 擷取方法:主體元件分析。 a. 擷取 3 個元件。 分析元件矩阵可以知道主要的犯罪类型为:强奸罪,抢劫罪,斗殴罪。 主成分与原始变量的线性关系式:

F1= 0.666X1+0.885X2+0.822X3+0.833X4+0.764X5+0.580X6 F2= -0.619X1-0.156X2+0.185X3-0.321X4+0.344X5+0.694X6 F3=0.279X1-0.261X2+0.369X3-0.079X4-0.471X5+0.290X6

元件 2 -.619 -.156 .185 -.321 .344

循环平方和累加三项后达87.62%达到要求,分析主成分分为三类。

旋轉元件矩陣

元件

1 杀人罪 .948 强奸罪 .593 抢劫罪 .505 斗殴罪 .732 偷盗罪 .097 汽车犯罪 -.033

a

2

.058 .699 .235 .494 .888 .251

3 .060 .190 .732 .150 .356 .915

擷取方法:主體元件分析。

轉軸方法:具有 Kaiser 正規化的最大變異法。a

分为三类,第一类:杀人罪,偷盗罪

第二类:强奸罪,斗殴罪 第三类:抢劫罪,汽车犯罪

(3)经过归一化处理,并与相应的系数相乘,得到如下结果:

3.采用因子分析法对美国50州的六种犯罪率数据进行分析,找出公共因子(假定2个),列出六种犯罪与公共因子的关系式,推导公共因子与六种犯罪的关系式,计算因子得分与综合得分,并对各州犯罪率按综合得分排序解释。 解:对于第二题采用因子分析法得出以下结论:

X1=0.805C1+0.036C2 X2=0744C1+0.478C2 X3=0.472C1+0.633C2 X4=0.789C1+0.324C2 X5=0.345C1+0.633C2 X6=0.026C1+0.803C2

C1=0.805X1+0.744X2+0.472X3+0.789X4+0.345X5+0.026X6 C2=0.036X1+0.478X2+0.633X3+0.324X4+0.663X5+0.803X6

4.某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。

品牌 A A A B B B C C C D D D D E E E E F F F F F F F F F G G G G G G 价格 21500 28400 42000 23990 33950 62000 26990 33400 38900 21975 25300 31965 27885 39895 39665 31010 46225 13260 16535 18890 19390 24340 45705 13960 9235 18890 19840 24495 22245 16480 28340 29185 发动机 1.8 3.2 3.5 1.8 2.8 4.2 2.5 2.8 2.8 3.1 3.8 3.8 3.8 4.6 4.6 3.0 5.7 2.2 3.1 3.1 3.4 3.8 5.7 1.8 1.0 3.4 2.5 2.5 2.7 2.0 3.5 3.5 功率 140 225 210 150 200 310 170 193 193 175 240 205 205 275 275 200 255 115 170 175 180 200 345 120 55 180 163 168 200 132 253 253 轴距 101.2 108.1 114.6 102.6 108.7 113.0 107.3 107.3 111.4 109.0 109.0 113.8 112.2 115.3 108.0 107.4 117.5 104.1 107.0 107.5 110.5 101.1 104.5 97.1 93.1 110.5 103.7 106.0 113.0 108.0 113.0 113.0 宽 67.3 70.3 71.4 68.2 76.1 74.0 68.4 68.5 70.9 72.7 72.7 74.7 73.5 74.5 75.5 70.3 77.0 67.9 69.4 72.5 72.7 74.1 73.6 66.7 62.6 73.0 69.7 69.2 74.4 71.0 74.4 74.4 长 172.4 192.9 196.6 178.0 192.0 198.2 176.0 176.0 188.0 194.6 196.2 206.8 200.0 207.2 200.6 194.8 201.2 180.9 190.4 200.9 197.9 193.2 179.7 174.3 149.4 200.0 190.9 193.0 209.1 186.0 207.7 197.8 轴距 2.639 3.517 3.850 2.998 3.561 3.902 3.179 3.197 3.472 3.368 3.543 3.778 3.591 3.978 3.843 3.770 5.572 2.676 3.051 3.330 3.340 3.500 3.210 2.398 1.895 3.389 2.967 3.332 3.452 2.911 3.564 3.567 燃料容量 13.2 17.2 18.0 16.4 18.5 23.7 16.6 16.6 18.5 17.5 17.5 18.5 17.5 18.5 19.0 18.0 30.0 14.3 15.0 16.6 17.0 16.8 19.1 13.2 10.3 17.0 15.9 16.0 17.0 16.0 17.0 17.0 燃料效率 28 25 22 27 22 21 26 24 25 25 23 24 25 22 22 22 15 27 25 25 27 25 22 33 45 27 24 24 26 27 23 23

解:将上述数据输入到SPSS软件,用因子分析法找出其简化的指标系统。

因子1由价格、发动机、功率和燃料容量相关性较大,主要表征发动机及其相关性能。

因子2有轴距1、轴距2、宽、长、燃料效率表征车的物理特征以及燃料的化学性质。

5.根据某年我国31个省市自治区的6项主要经济指标数据,进行因子分析,找出公因子并进行适当的解释,计算各地区的因子得分并进行排序。

地区北 京天 津河 北山 西内蒙古辽 宁吉 林黑龙江上 海江 苏浙 江安 徽福 建江 西山 东河 南湖 北湖 南广 东广 西海 南重 庆四 川贵 州云 南西 藏陕 西甘 肃青 海宁 夏新 疆人均GDP50467411631696214123200532178815720161955769528814318741005521471107982379413313132961195028332102961265412457105465787897010430121388757117621184715000财政收入固定资产投资年末总人口居民消费水平社会消费品零售总额111715143296.41581167703275.241704791820.51075105641356.862053405470.2689849453397.458337522255.7337548431613.434337743363.2239758001595.381767185689.6427169293434.624520452594.3272357101675.838684402236.0382351411997.7157607423900.01815209443360.41656682010069.2755083026623.2129820447590.24980111615325.342802653533.6611044412029.454117072981.8355878262704.230552142683.6433941731428.01356252611111.4930970257122.567917155904.7939246323880.547608233343.5569355333412.047792743175.5634254982834.2217946087973.49304108299118.134257882198.7471943301600.8818139423.98364736308.331771652407.4280854171403.660758504412.9816945013421.622681571197.437573499689.837997022208.6448340751188.9145607231.1281291589.736248052480.7373539721522.014121521022.626063810717.5422437408.55484229180.1613570498.76045112199.021946281567.120504206727.6 解:31个省市自治区的6项主要经济指标数据,进行因子分析。

KMO检验和巴特利球体检验,KMO检验系数=0.763>0.5

P值<0.05,所以能进行因子分析。

分析结果如下图所示:

因子1主要由财政收入、固定资产投资、年末人口数及社会消费品零售总额。主要表征宏观的经济指标;

因子2 由人均GDP和居民消费水平,主要表征微观的指标回归到居民层面生活水平。

地区的因子得分并进行排序:

广东 江苏 山东 上海 浙江 北京 河南 辽宁 河北 四川 福建 天津 湖北 湖南5.12 4.38 4.32 4.14 3.74 3.35 2.53 2.45 2.28 2.10 1.88 1.87 1.83 1.75 黑龙

山西 吉林 广西 江西 陕西 重庆 云南 新疆 贵州 甘肃 海南 宁夏 青海1.35 1.32 1.19 1.16 1.13 1.13 1.10 1.06 0.77 0.63 0.55 0.39 0.36 0.28 安徽

内蒙

1.52 1.39 西藏 0.10

6.以第5题数据为例,采用分层聚类法分析聚类过程,并对结果详细解释。 解:对于第五题给出的数据进行聚类分析

表(1)

表(2)

表(3)

表(4)

结果分析如下

表(1)、表(2)、表(3)、表(4)显示共31个省市自治区进入聚类分析采用相关系数测量技术,先显示各变量间的相关系数这对于后面选择典型变量是十分有用的然后显示类间平均链锁法的合并进程即第一步7与22被合并它们之间的相关系数最大为202098.45

第二步21与30合并其间相关系数为212741.530 第三步20与25合并其间相关系数为290480.620 第四步14与第三步合并其间相关系数为373585.330 第五步4与8合并其间相关系数为437582.580 第六步21与29合并其间相关系数为573991.825 第七步28与31合并 第八步17与18合并 第九步14与27合并

。。。。。。。。。。。。。。。。具体结果看树状图.

图(4)显示按类间平均链锁法变量合并过程的冰柱图如上所示

7.以第5题数据为例,采用K均值聚类法计算聚类中心,将每个省级单元归入相应类别。

解:将第五题做K均值聚类法计算。

首先 将数据输入到spss软件,设置相关分析。得出以下结论:

表(1)

表(2)

表(3)

表(4)

表(5)

数据输出如上图所示,表(1)到表(3)显示首先系统根据要求的按4 类聚合确定初始聚类的各变量中心点未经K-means 算法叠代其类别间距离并非最优经叠代运算后类别间各变量中心值得到修正。

表4,表5显示对聚类结果的类别间距离进行方差分析方差分析表明类别间距离差异的概率值均人均GDP,财政收入,固定资产投资,居民消费水平,社会消费品零售总额均<0.001,年末总人口=0.004在0.001——0.005之间即聚类效果好,这样原有31个省市自治区聚合成4 类第一类含原有10类第二类含原有5类第三类含原有1类第四类含原有15 类具体结果系统以变量名QCL_1 存于原始数据文件中如下图所示:

北 天 河 山 内辽 吉 黑

上 江 浙 安 福 江 山 河 湖 湖京 津 北 西 蒙龙

广古 宁 林 江

海 苏 江 徽 建 西 东 南 北 南 东2 1 1 1 4 1 4 4 2 2 2 1 1 4 2 1 1 1 3

贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

4 4 4 4 4 4 4 4

广 海西 南4 4 重庆4

在原始数据文件中我们可清楚地看到聚类结果参照各项指标将每个省级单元归入相应类别:

第一类:天津,河北,山西,辽宁,安徽,福建,河南,湖北,湖南。 第二类:北京,上海,江苏,浙江,山东。 第三类:广东

第四类:内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆。

8某体育训练项目采用6个指标(x1-x6)评价运动员的竞技水平,分成两个级别,数据记录如下表。 No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Level 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 x1 3.6 3.3 3.3 3.2 3.1 3.2 3.3 3.5 3.7 3.4 3.6 3.6 3.6 3.4 3.3 3.1 3.1 3.6 3.7 3.3 3.8 3.7 3.5 3.4 3.3 3.7 x2 4.3 4.1 4.2 4.1 4.4 4.9 4.2 4.5 4.6 4.4 4.3 4.5 4.2 4.2 4.3 4.2 4.2 4.2 4.4 4.3 4.1 4.3 4.2 4.1 4.1 4.1 x3 82.3 87.5 87.7 88.6 90 89.1 89 84.2 82.1 90.2 82.1 82 82.2 85.4 90.1 89 90.2 82 81 90 80 83.9 85.4 86.7 88.1 84.1 x4 70 80 85 75 95 85 75 80 70 75 70 55 70 85 80 85 85 65 80 80 60 85 85 85 75 70 x5 90 100 115 100 120 105 85 100 85 100 90 70 90 100 100 100 115 80 95 110 80 100 100 110 85 95 x6 18.52 18.48 18.56 19.1 20.14 19.44 19.17 18.8 17.68 19.14 18.1 17.4 18.12 18.66 19.86 20 20.8 17.2 17 19.8 16.89 18.76 18.7 18.5 18.96 18.7 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3.6 3.2 3.4 3.3 3.1 3.8 3 3.9 3.5 3.1 3.3 3.1 3.1 3.6 3.1 3 3.4 3.6 3.3 3.3 3.5 3.4 3.6 3.1 3.1 3.6 3.5 4.3 4.2 4 4.5 4.5 4.1 4.2 3.7 4.1 3.9 3.9 4 3.9 4.3 3.9 3.9 3.9 3.8 4 4.4 4.1 4.2 4.1 4.4 4 4.1 4.3 82 89.2 103 118 105 104.5 112 98.2 98.7 98.2 109 98.4 95.3 93.6 95.8 93.8 96.3 98.6 97.4 112 107.7 92.1 99.5 116 102.7 115 97.8 70 85 95 90 85 80 95 85 90 60 100 95 90 75 80 85 110 85 85 75 88 80 85 75 80 85 75 90 115 110 120 110 100 125 90 120 90 120 115 110 85 105 90 120 120 100 110 110 120 120 110 110 115 100 18.4 19.88 24.8 25.7 25.1 24.98 25.35 21.8 22.78 21.98 25.3 25.2 21.42 20.84 21.8 21.08 21.98 22.36 22.34 25.1 25.1 22.16 23.1 25.3 24.68 23.7 24.1 分别采用距离判别法、Fisher判别法和逐步判别法,试建立一个合理的判别标准,然后利用这一标准对未知类别的新运动员进行分类。

解:(1)Fisher判别法

群組平均值的等式檢定 X1 X2 X3 X4 X5 X6

聯合組內矩陣 X2 X3 -.064 -.317 1.000 .337 .337 1.000 -.109 .243 .070 .454 Wilks' Lambda (λ) .967 .801 .321 .844 .796 .228 F 1.751 12.647 107.974 9.462 13.079 172.766 df1 1 1 1 1 1 1 df2 51 51 51 51 51 51 顯著性 .192 .001 .000 .003 .001 .000 相關 X1 X2 X3 X4 X5 X6 X1 1.000 -.064 -.317 -.301 -.386 -.386 X4 -.301 -.109 .243 1.000 .738 X5 -.386 .070 .454 .738 1.000 .546 X6 -.386 .326 .806 .355 .546 1.000 .326 .806 .355 變數已輸入/已移除a,b,c,d Wilks' Lambda (λ) 確切 F df3 df1 df2 1 51.00172.751.00X6 .228 1 1 1 0 66 0 2 51.00118.450.00X2 .174 2 1 2 0 67 0 3 51.0086.8049.00X5 .158 3 1 3 0 0 0 在每一個步驟中,輸入最小化整體 Wilks' Lambda 的變數。 a. 步驟的數目上限為 12。 b. 要輸入的局部 F 下限為 3.84。 c. 要移除的局部 F 上限為 2.71。 d. F 層次、容差或 VIN 不足,無法進行進一步計算。

步驟 已輸入 統計資料 df1 df2 統計資料 顯著性 .000 .000 .000 Wilks' Lambda (λ) 確切 F 步驟 1 2 3

分類函數係數

LEVEL

X2 X5 X6 常數

1 97.943 .321 4.372 -267.004

費雪 (Fisher) 線性區別函數

2 84.673 .168 8.499 -282.903

變數Lambd數目 a (λ) 1 2 3 .228 .174 .158 df1 1 2 3 df2 1 1 1 df3 51 統計資料 df1 df2 51.001 0 50.002 0 49.003 0 顯著性 .000 .000 .000 172.766 118.451 67 86.8051 0 9. 某品牌家电在两个城市销售,其中A城市有6个商场、B城市有8个商场销售,下表是各商场一年的销售量,试分析该品牌家电在这两个城市的销售量是否有显著差异?(a=0.05) 商场序号 1 2 3 4 5 6 解:将数据输入到R软件,并进行显著性分析有: > sale<-data.frame(Y=c(545,489,505,585,539,449,

+ + + 560,551,535,479,476,545,602,495),X=factor(rep(1:2,c(6,8)))) > sale.aov<-aov(Y~X,data=sale) > summary(sale.aov)

Df Sum Sq Mean Sq F value Pr(>F) X 1 470 470 0.226 0.643 Residuals 12 24943 2079

分析结论可知,X因素的P值为0.643>>0.05即影响不显著的

A城 545 489 505 585 539 449 商场序号 1 2 3 4 5 6 7 8 B城 560 551 535 479 476 545 602 495

10.某项录用考试有面试和笔试两部分,抽取由8名考生组成的样本,其中成绩如下表,计算秩相关系数并进行显著性检验。(a=0.05) 考生 1 2 3 4 5 6 7 8 面试成绩(分) 78 74 97 60 86 81 62 91 笔试成绩(分) 77 83 88 65 78 86 64 93 解:将数输入到R软件,面试成绩记为X,笔试成绩记为Y: > score<-data.frame(

+ X=c(78,74,97,60,86,81,62,91), + Y= c(77,83,88,65,78,86,64,93) + )

> lm.sol<-lm(Y ~ X, data=score) > summary(lm.sol) Call:

lm(formula = Y ~ X, data = score)

Residuals:

Min 1Q Median 3Q Max -6.435 -3.713 -1.483 5.058 7.002

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 23.9733 12.4768 1.921 0.10306 X 0.7030 0.1568 4.484 0.00418 ** ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.422 on 6 degrees of freedom Multiple R-squared: 0.7701, Adjusted R-squared: 0.7318 F-statistic: 20.1 on 1 and 6 DF, p-value: 0.004176 分析计算结果有:

1)回归系数X=0.00418<0.01所以显著性好 2)回归方程P值=0.004176<0.01所以显著性好 综上考生面试和笔试两部分成绩显著。

秩相关系数

本文来源:https://www.bwwdw.com/article/3zl3.html

Top