数据分析及其应用软件习题

更新时间:2024-05-25 03:13:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《数据分析及其应用软件》习题

姓名__ 学号_ _ _成绩

习题1:出钢时所用盛钢水的钢包,因钢水对耐火材料的侵蚀,容积不断增大

我们希望找出使用次数与增大的容积之间的关系,试验数据如下:

使用次数x 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

写出分析报告(内容包括以下四点) 1. 用双曲线1/y = a+b/x作曲线拟合:(1)画出散点图, (2)写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05)

2. 用指数曲线y = aeb/x 作曲线拟合: (1)画出散点图, (2)写出回归方程, (3)进行检验, (4)分析结果, (α= 0.05) 3. 比较两种曲线后,写出较优的曲线回归方程.

4. 使用较优的曲线回归方程预测当使用次数为17次时钢包的容积增大多少?

增大容积y 6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76 习题2:1.研究货运总量Y(万吨)与工业总值X1(亿元)、农业总产值X2(亿元)、居民非商品支出X3(亿元)的关系。数据见下表

编号 货运总量 工业总产值 农业总产值 居民非商品支出Y(万吨) 1 2 3 160 260 210 X1(亿元) 70 75 65 X2(亿元) 35 40 40 X3(亿元) 1.0 2.4 2.0 4 5 6 7 8 9 10 265 240 220 275 160 275 250 74 72 68 78 66 70 65 42 38 45 42 36 44 42 3.0 1.2 1.5 4.0 2.0 3.2 3.0

(1)计算出 Y,X1,X2,X3 的相关系数矩阵;

(2)求Y关于X1,X2,X3的三元线性回归方程; (3)对所求得的回归方程作拟合优度检验; (4)对回归方程做显著性检验; (5)对每一个回归系数做显著性检验;

(6)如果有的回归系数没有通过显著性检验,将其剔除。

重新建立回归方程,再作回归方程的显著性检验和回归系数显著性

检验;

(7)求出每一个回归系数的之置信水平为95%的置信区间; (8)求出标准化回归方程;

(9)求当X01=75,X02=42,X03=3.1时的Y0值,给定置信水平为99%,

用SPSS软件计算精确置信区间,用手工计算近似预测区间;

(10)结合回归方程对问题作一些基本分析。

习题3:为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3

类,指标及原始数据如下表。利用费歇线性判别函数,判定另外4个待判样品属于哪一类?

某地区人口死亡状况指标及原始数据表

组别

序 X1= 0岁组 号

死亡概率

34.16 33.06 36.26 40.17 50.06 33.24 32.22

X2=1岁组

死亡概率 7.44 6.34 9.24 13.45 23.03 6.24 4.22

X3= 1 0岁

组死亡概率 1.12 1.08 1.04 1.43 2.83 1.18 1.06

X4=55岁

组死亡概率 7.87 6.77 8.97 13.88 23.74 22.90 20.70

X5=80岁

组死亡概率

X6=平均

预期寿命 69.30 69.70 68.80 66.20 63.30 65.40 68.70

第一组 1

2 3 4

5 第二组 1 2 95.19

94.08 97.30 101.20 112.52 160.01 124.70

3 4 5 1 2

第三组 3 41.15 53.04 38.03 34.03 32.11 44.12 10.08 25.74 11.20 5.41 3.02 15.12 2.32 4.06 6.07 0.07 0.09 1.08 32.84 34.87 27.84 5.20 3.14 15.15 172.06 152.03 146.32 90.10 85.15 103.12 65.85 63.50 66.80 69.50 70.80 64.80 待 判 样 品

习题4:地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州

4 54.17 25.03 2.11 25.15 5 28.07 2.01 0.07 3.02 1 50.22 6.66 1.08 22.54 2 34.64 7.33 1.11 7.78 3 33.42 6.22 1.12 22.95 4 44.02 15.36 1.07 16.45 对中国乡镇企业绩效的进行聚类分析.数据见表1.

表1、原始数据

净利润 营业收入 增加值率 企业个数

盈利个数567266 9571555 22.37 118754 117100 1220685 15752865 22.06 121329 120836 6114274 76293862 25.67 1012984 979370 1195722 14942048 26.15 294139 277568 3111870 30425815 28.45 911161 905113 4285894 63966481 24.59 1028432 1015913 1530642 19087038 27.17 764616 755917 534765 11755916 24.17 245869 245746 923336 20663611 21.29 37692 21902 2594757 95448009 21.44 903456 885401 5582807 127806784 21.17 1081514 1010268 1790990 24180813 28.37 710774 695017 2334878 55988718 22.62 807022 740241 947204 14546944 25.85 717680 693557 4602505 109758971 21.6 2048217 1950135 5298053 60458827 26.09 1081731 1043324 2005403 45241972 22.85 926207 891023 4255453 69601456 25.71 2226562 2169514 4277645 85557573 23.72 766557 726893 989634 22889759 20.59 867907 832509 120524 1501225 26.12 40719 39811 271802 9225735 23.64 106691 105284 910281 37355764 19.34 1374560 1348002 669816

6381031 25.52

372996

320339

110.14 81.22 170.60 95.16 160.31 105.30 全员劳动生产率 20698 29242 23661 16115 21476 37607 22758 18796 42769 28529 32250 14342 25070 13515 20274 18701 17094 20262 23573 10570 14270 15351 14009 12429

63.70 68.30 65.20 69.30 68.30 64.20

830682 17790905 22.05 654923 650341 10539 云南

西藏

1103286 20162275 25.11 897491 868285 12591 陕西

419893 6701579 22.3 224908 222668 10595 甘肃

34616 649227 20.98 54865 53228 7394 青海

109083 1565055 24.16 130357 129507 7644 宁夏

191764 3071497 24.68 316524 304569 9248 新疆

续表一、原始数据

流动资产 固定资产 职工人数 银行借款 资本金 地区

4659389 3931311 1018117 1024308 2924903 北京

4943290 4148950 1204863 1180493 2303981 天津

12465461 17484175 8226605 4038086 10332912 河北

3557340 5780890 2804201 938541 2934108 山西

3227037 5267496 4016866 460290 3333205 内蒙古

8763313 9329875 4539619 1999724 6980228 辽宁

2372734 3614685 2494526 513310 2409414 吉林

1861422 2679007 1451692 563340 1871204 黑龙江

10832675 7789596 1379837 2684161 6258380 上海

32606238 25073003 7680355 8096730 16462531 江苏

34257475 29714853 8311974 9979972 20763537 浙江

5089323 7351798 4747880 1450082 4952914 安徽

9853152 11160445 5436920 1646883 10778050 福建

2264148 3399940 3025862 844116 2425545 江西

25610281 26447082 12671968 6284596 14179543 山东

11262505 15312738 8389316 2711629 9442756 河南

8419188 10129567 6216411 2027642 6427542 湖北

7557258 9399762 9262393 1699073 6723945 湖南

24910272 32230553 9232307 6736240 19485556 广东

3234113 5269620 3471206 871565 3214208 广西

278001 796182 275868 182675 465657 海南

2418088 2267023 1499882 624348 1656726 重庆

6569307 7031491 5938049 2504647 5130203 四川

3241104 1774185 1406217 541997 2387169 贵州

3301461 5809520 2546765 1031743 2912189 云南

西藏

3224570 3934343 3850600 1148287 2769354 陕西

1364007 1735031 1531755 501074 1124357 甘肃

176344 363754 232662 124070 209130 青海

411855 679716 484183 147424 429111 宁夏

790981 1266081 752463 263604 677916 新疆

习题5:利用主成分分析方法和下表中20个城市高新技术产业化能力数据,

《对20个城市高新技术产业化能力进行横向评价》

20个城市高新技术产业化能力指标和数值表(2006年原始数据)

一级指标 二级指标

高新技术产业化

高新技术产业化水平 高新技术产业化效益 知识密集高新技术

高技术产新产品销

型产业增产品出口高技术产高技术知识密集

业增加值售收入占

三级指标 加值占生额占商品业劳动生产业增型产业劳

占工业增产品销售

产总值比出口额比产率 加值率 动生产率

加值比重 收入比重

重 重

地 区 % % % % 万元/人 % 万元/人 北京 26.57 32.45 46.01 17.64 21.51 18.38 21.94 天津 24.39 10.01 47.39 28.12 30.63 26.38 17.39 沈阳 9.32 8.93 27.36 19.57 11.76 27.29 19.09 大连 10.45 12.33 14.41 10.91 15.56 27.81 37.70 长春 3.22 10.35 6.81 45.11 10.33 42.24 21.18 哈尔滨 14.01 8.72 4.24 15.95 10.09 30.91 16.88 上海 19.24 17.72 40.60 30.14 21.56 20.79 26.80 南京 16.95 10.70 26.00 19.50 18.63 18.39 31.90 苏州 31.84 7.28 65.83 7.52 12.92 22.17 69.21 杭州 12.51 12.36 34.32 16.56 16.08 14.76 33.48 宁波 6.59 9.94 5.89 13.97 5.91 17.62 49.76 厦门 42.41 10.92 32.90 22.61 17.82 25.53 44.63 济南 34.45 10.99 10.19 17.73 29.76 38.37 29.39 青岛 8.80 7.74 11.63 32.41 16.33 24.69 38.84 武汉 17.26 11.47 26.82 10.65 24.94 37.12 19.23 广州 8.81 12.08 23.71 17.88 9.15 23.59 34.99 深圳 51.82 13.02 48.22 15.53 15.00 20.68 51.15 重庆 6.24 8.14 4.37 31.46 10.70 34.78 10.22 成都 16.85 12.50 20.88 17.97 14.38 37.13 25.71 西安 27.80 14.32 13.82 12.94 9.32 33.70 13.42 全国 11.04 9.67 29.04 14.80 13.08 23.94 14.59

(数据参见附件表2:“2003-2006年高新技术产业化”数据。利用其中2006年-未经过修正的原始数据)

习题6: 对中国乡镇企业绩效的进行因子分析.数据见表1.

解题要求:

① 一律用SPSS软件做(并下载计算结果,包括相应的图、表等)。 ② 答案用A4纸打印,小标题用4号字黑体,正文用小4号字。

③ 2012年5月9日( 周3 )下午3:00交至8-603A(打印版

和电子版)。

本文来源:https://www.bwwdw.com/article/aib7.html

Top