《多元统计分析》第三版例题习题数据文件
更新时间:2024-04-11 07:09:01 阅读量: 综合文库 文档下载
何晓群《多元统计分析》第三版(2012)数据下载
第一章
[例2-1] 1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。
一、均值向量的估计 DESCRIPTIVES
VARIABLES=v1 v2 v3 v4 v5 v6 v7 v8 /STATISTICS=MEAN.
Descriptive Statistics
N
Mean V1 35 4.4940 V2 35 2.6043 V3 35 56.1046 V4 35 .5037 V5 35 1.2711 V6 35 4.6326 V7 35 -1.6983 V8 35 5.5289 Valid N 35 (listwise)
二、协方差阵的估计 CORRELATIONS
VARIABLES=v1 v2 v3 v4 v5 v6 v7 v8 /PRINT=TWOTAIL NOSIG /STATISTICS XPROD /MISSING=PAIRWISE.
1
第2章
[例2-1] 1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。
表2-1 净资产收 行业 公司简股票代称 深圳能源 深南电A 富龙热电 穗恒运A 粤电力电力、煤气及水的生产和供应业 A 韶能股份 000601 -2.95 -1.86 -1.29 -.81 61.79 63.34 .27 .40 2.52 1.09 .53 .43 15.77 8.08 -4.67 -1.82 000539 .34 -1.15 54.84 .48 2.42 .52 11.78 -7.72 000531 -7.70 -1.53 70.25 .57 2.70 .61 -29.45 -7.15 000426 -11.30 -5.56 48.89 .13 .76 -.34 -40.10 -9.93 000037 .61 1.23 61.17 .60 1.74 1.41 -12.81 -.01 000027 9.17 4.92 53.45 .39 1.57 3.56 2.76 33.00 码 益率 总资产资产负总资产流动资产已获利销售增资本积报酬率 债率 周转率 周转率 息倍数 长率 累率 ST惠天 000692 城投控股 大连热电 华电能源 国电电力 长春经开 大龙地房地行业 产 金丰投资 600606 600159 600215 600795 600726 600719 600649 12.28 8.46 39.92 .25 .57 40.20 29.21 -2.19 1.58 .96 60.53 .32 .70 1.31 -3.44 .75 .43 .33 77.63 .40 2.39 1.08 12.66 -6.04 1.26 .20 71.65 .26 1.68 1.10 -5.88 5.68 .09 .21 29.10 .05 .08 1.23 9.07 .09 1.21 .09 61.63 .04 .05 1.84 -57.90 -.08 9.78 6.81 6.51 5.96 46.07 31.91 .20 .12 .31 .31 6.22 5.57 -51.99 -8.40 -18.48 4.99 2
新黄浦 600638
浦东金桥 600639 9.02 6.90 6.16 2.09 42.74 78.11 .20 .70 .86 2.47 4.51 7.04 40.62 19.88 4.75 5.21 外高桥 600648 中华企业 渝开发A 莱茵置业 粤宏远A 中国国贸 600007 000573 000514 600675 14.31 6.82 63.67 .37 .44 5.89 33.93 11.82 6.53 5.14 31.61 .14 .40 4.42 -15.56 6.64 000558 21.22 7.95 73.67 .44 .52 1.04 -13.15 28.42 -8.47 -4.84 44.12 .14 .24 -3.90 -26.72 -7.81 8.40 6.21 5.77 48.06 67.44 .12 .37 3.04 .39 1.10 10.62 1.20 15.38 5.06 8.93 万科A 000002 12.65 三木集团 国兴地产 000838 2.97 9.69 000632 1.96 1.05 80.12 .88 .95 1.74 -11.30 -9.55 2.21 1.72 44.34 80.11 .17 .47 .17 .57 30.65 2.03 -74.76 -7.90 3.06 1.59 中关村 000931 中兴通讯 长城电脑 南天信息 同方股份 信息技术业 永鼎股份 宏图高科 600105 600100 000948 000066 000063 11.65 5.02 70.15 .98 1.21 4.28 27.36 17.40 1.01 .39 53.93 1.35 3.57 1.22 -6.99 -30.87 9.48 6.61 45.43 1.06 1.41 4.62 15.13 110.72 3.57 2.63 53.32 .78 .00 2.79 -4.77 26.72 2.54 1.69 71.91 .42 .63 1.87 27.49 2.63 600122 10.71 4.54 5.42 3.74 57.49 31.88 1.77 .86 2.12 1.09 3.21 7.49 33.03 18.42 11.23 -6.27 新大陆 000997 方正科技 复旦复华 600624 600601 4.42 3.16 43.95 1.40 4.67 3.06 -13.58 4.73 4.44 3.68 49.44 .53 .85 3.19 13.57 2.60 习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。
边远及少数民族聚居区的社会经济水平发展的指标数据: 地区
人均GDP 三产比重 人均消费 人口增长 文盲半文盲 3
内蒙古 广西 贵州 云南 西藏 宁夏 新疆 甘肃 青海 5068 4076 2342 4355 3716 4270 6229 3456 4367 31.1 34.2 29.8 31.1 43.5 37.3 35.4 32.8 40.9 2141 2040 1551 2059 1551 1947 2745 1612 2047 8.23 9.01 14.26 12.1 15.9 13.08 12.81 10..04 14.48 15,83 13.32 28.98 25.48 57.97 25.56 11.44 28.65 42.92 数据来源:《中国统计年鉴》(1998)。 5项指标的全国平均水平
μ0=(6212.01 32.87 2972 9.5 15.78)/
General Linear Model
Notes
Output Created Comments Input
Active Dataset Filter Weight Split File
N of Rows in Working Data File
Missing Value Handling Definition of Missing
User-defined missing values are treated as missing.
Cases Used
Statistics are based on all cases with valid data for all variables in the model.
Syntax
GLM V1 V2 V3 V7 BY level /CONTRAST(level)=Simple(1) /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /POSTHOC=level(LSD)
/PRINT=DESCRIPTIVE ETASQ OPOWER HOMOGENEITY
/CRITERIA=ALPHA(.05) /DESIGN= level.
4
数据集0
35 04-9月-2013 15时52分28秒 Resources Processor Time 00 00:00:00.031 Elapsed Time
00 00:00:00.032
[数据集0]
Between-Subjects Factors
Value Label N
行业
1.00
电力、煤气及水11 的生产和供应业
2.00 房地产业 15 3.00
信息技术业
9 Descriptive Statistics 行业 Mean Std. Deviation N 净资产收益率 电力、煤气及水的生产和供应.1691 6.62172 11 业 房地产业 6.8713 6.92215 15 信息技术业 5.8178 3.80389 9 Total 4.4940 6.71117 35 总资产报酬率 电力、煤气及水的生产和供应.5236 3.63652 11 业 房地产业 3.5367 3.51537 15 信息技术业 3.5933 1.92033 9 Total 2.6043 3.44801 35 资产负债率 电力、煤气及水的生产和供应60.3145 10.78281 11 业 房地产业 54.8467 18.28147 15 信息技术业 53.0556 12.60330 9 Total 56.1046 14.76758 35 销售增长率 电力、煤气及水的生产和供应-1.0382 20.36621 11 业 房地产业 -10.5120 32.91135 15 信息技术业 12.1844 16.83557 9 Total -1.6983 26.83506 35 5
Box's Test of Equality
of Covariance Matrices
Box's M F df1 df2 Sig.
Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups.
a. Design: + level
29.207 1.172 20 2585.573 .269 a
Multivariate Tests Effect Value Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root level Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root
Multivariate Tests Partial Eta Effect Squared Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root level Pillai's Trace Wilks' Lambda
.967 .967 .967 .967 .240 .250 Noncent. Parameter 837.620 837.620 837.620 837.620 18.980 19.290 Observed Power 1.000 1.000 1.000 1.000 .849 .854 6
bddF 209.405 209.405 209.405 209.405 2.373 2.411 2.443 4.193 caaaaaHypothesis df 4.000 4.000 4.000 4.000 8.000 8.000 8.000 4.000 Error df 29.000 29.000 29.000 29.000 60.000 58.000 56.000 30.000 Sig. .000 .000 .000 .000 .027 .025 .024 .008 .967 .033 28.883 28.883 .481 .563 .698 .559 Hotelling's Trace Roy's Largest Root
.259 .359 19.547 16.773 .858 .875
a. Exact statistic
b. Computed using alpha = .05
c. The statistic is an upper bound on F that yields a lower bound on the significance level. d. Design: + level
Levene's Test of Equality of Error Variances a 净资产收益率 总资产报酬率 资产负债率 销售增长率 F .500 1.759 4.537 1.739 df1 2 2 2 2 df2 32 32 32 32 Sig. .611 .188 .018 .192 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: + level Tests of Between-Subjects Effects Dependent Variable Corrected Model 净资产收益率 总资产报酬率 资产负债率 销售增长率 Type III Sum of Squares 306.300 69.464 302.366 2904.588 615.338 218.016 105315.459 1.497 306.300 69.464 302.366 2904.588 1225.054 334.753 edcadf 2 2 2 2 1 1 1 1 2 2 2 2 32 32 Mean Square 153.150 34.732 151.183 1452.294 615.338 218.016 105315.459 1.497 153.150 34.732 151.183 1452.294 38.283 10.461 F 4.000 3.320 .680 2.154 16.073 20.841 473.833 .002 4.000 3.320 .680 2.154 level 净资产收益率 总资产报酬率 资产负债率 销售增长率 净资产收益率 总资产报酬率 资产负债率 销售增长率 Error 净资产收益率 总资产报酬率 7
资产负债率 销售增长率 Total 净资产收益率 总资产报酬率 资产负债率 销售增长率 Corrected Total 净资产收益率 总资产报酬率 资产负债率 销售增长率 7112.406 21579.511 2238.216 641.598 117585.075 24585.045 1531.354 404.217 7414.772 24484.099 32 32 35 35 35 35 34 34 34 34 222.263 674.360 Tests of Between-Subjects Effects Dependent Variable Corrected Model 净资产收益率 总资产报酬率 资产负债率 销售增长率 Sig. .028 .049 .514 .133 .000 .000 .000 .963 .028 .049 .514 .133 Partial Eta Squared .200 .172 .041 .119 .334 .394 .937 .000 .200 .172 .041 .119 Noncent. Parameter 8.001 6.640 1.360 4.307 16.073 20.841 473.833 .002 8.001 6.640 1.360 4.307 Observed Power .674 .587 .154 .408 .973 .993 1.000 .050 .674 .587 .154 .408 b level 净资产收益率 总资产报酬率 资产负债率 销售增长率 净资产收益率 总资产报酬率 资产负债率 销售增长率 Error 净资产收益率 总资产报酬率 资产负债率 销售增长率 Total 净资产收益率 总资产报酬率 资产负债率 销售增长率 Corrected Total 净资产收益率 总资产报酬率 资产负债率 销售增长率
8
a. R Squared = .200 (Adjusted R Squared = .150) b. Computed using alpha = .05
c. R Squared = .172 (Adjusted R Squared = .120) d. R Squared = .041 (Adjusted R Squared = -.019) e. R Squared = .119 (Adjusted R Squared = .064)
Custom Hypothesis Tests
Contrast Results (K Matrix)
Dependent Variable
行业 Simple Contrast
Level 2 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Level 3 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Contrast Results (K Matrix)
Dependent Variable
行业 Simple Contrast
aa
净资产收益率
6.702 0 6.702 2.456 .010 1.699 11.705 5.649 0 5.649 2.781 .051 -.016 11.313 Upper Bound
Upper Bound
总资产报酬率
9
Level 2 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Level 3 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Contrast Results (K Matrix)
Upper Bound Upper Bound
3.013 0 3.013 1.284 .025 .398 5.628 3.070 0 3.070 1.454 .043 .109 6.031 Dependent Variable
行业 Simple Contrast
Level 2 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Level 3 vs. Level 1 Contrast Estimate
Hypothesized Value
Difference (Estimate - Hypothesized) Std. Error Sig.
95% Confidence Interval for Lower Bound Difference
Upper Bound Upper Bound
a
资产负债率
-5.468 0 -5.468 5.918 .362 -17.523 6.587 -7.259 0 -7.259 6.701 .287 -20.908 6.390 销售增长率
-9.474 0 -9.474 10.308 .365 -30.471 11.524 13.223 0 13.223 11.672 .266 -10.552 36.998
a. Reference category = 1
Multivariate Test Results
10
Pillai's trace Wilks' lambda Hotelling's trace Roy's largest root
Partial Eta Value .481 .563 .698 .559 F 2.373 2.411 2.443 4.193 cbHypothesis df 8.000 8.000 8.000 4.000 Error df 60.000 58.000 56.000 30.000 Sig. .027 .025 .024 .008 Squared .240 .250 .259 .359 Multivariate Test Results
Pillai's trace Wilks' lambda Hotelling's trace Roy's largest root
Noncent. Parameter
18.980 19.290 19.547 16.773 Observed Power .849 .854 .858 .875 a
a. Computed using alpha = .05 b. Exact statistic
c. The statistic is an upper bound on F that yields a lower bound on the significance level.
Univariate Test Results Source Dependent Variable Sum of Squares 306.300 69.464 302.366 2904.588 1225.054 334.753 7112.406 21579.511 df 2 2 2 2 32 32 32 32 Mean Square 153.150 34.732 151.183 1452.294 38.283 10.461 222.263 674.360 F 4.000 3.320 .680 2.154 Sig. .028 .049 .514 .133 Contrast 净资产收益率 总资产报酬率 资产负债率 销售增长率 Error 净资产收益率 总资产报酬率 资产负债率 销售增长率 Univariate Test Results
Partial Eta
Source
Dependent Variable
Squared
.200 .172 .041 .119 Noncent. Parameter
8.001 6.640 1.360 4.307 Observed Power .674 .587 .154 .408 a
Contrast 净资产收益率
总资产报酬率 资产负债率 销售增长率
11
Error 净资产收益率 总资产报酬率 资产负债率 销售增长率
a. Computed using alpha = .05
第3章
例3-1 若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。在表中,“标准工资收入” 、“职工奖金” 、“职工津贴” 、“性别” 、“就业身份”等称为指标,每户称为样品。若对户主进行分类,还可以采用其他指标,如“子女个数” 、“政治面貌” 等,指标如何选择取决于聚类的目的。 表3-1 某市2001年城镇居民户主个人收入数据
X1 职工标准工资收入 X5 单位得到的其他收入 X2 职工奖金收入 X6 其他收入 X3 职工津贴收入 X7 性别 X4 其他工资性收入 X8 就业身份 X1 540.00 1137.00 1236.00 1008.00 1723.00 1080.00 1326.00 1110.00 1012.00 1209.00 1101.00
X2 0.0 125.00 300.00 0.0 419.00 569.00 0.0 110.00 88.00 102.00 215.00
X3 0.0 96.00 270.00 96.00 400.00 147.00 300.00 96.00 298.00 179.00 201.00
X4 0.0 0.0 0.0 0.0 0.0 156.00 0.0 0.0 0.0 67.00 39.00
X5 0.0 109.00 102.00 86.0 122.00 210.00 148.00 80.00 79.00 198.00 146.00 Dutch een twee drie vier
X6 6.00 812.00 318.00 246.00 312.00 318.00 312.00 193.00 278.00 514.00 477.00 German ein zwei drei vier
X7 男 女 女 男 男 男 女 女 女 男 男
X8 国有 集体 国有 集体 国有 集体 国有 集体 国有 集体 集体 French un deux trois quatre
例3-3
English One Two Three Four
Norwegian En To Tre Fire
Danish en to tre fire
12
Five Six seven Eight Nine Ten
Spanish Uno Dos Tres cuatro Cinco Seix Siete Ocho nueve Diez
Fem Seks Sju Ate Ni Ti
Italian uno due tre quattro cinque sei sette otto nove dieci
fem seks syv otte ni ti
Polish jeden dwa trzy cztery piec szesc siedem osiem dziewiec dziesiec
vijf zes zeven acht negen tien funf sechs siebcn acht neun zehn
Hungarian egy ketto harom negy ot hat het nyolc kilenc tiz
Finnish
einq six sept huit neuf dix
yksi kaksi kolme neua viisi kuusi seitseman kahdeksau yhdeksan kymmenen
例3-4
X1 食品支出(元/人) X5 交通和通讯支出(元/人)
X2 衣着支出(元/人) X6 娱乐、教育和文化服务支出(元/人) X3 家庭设备、用品及服务支出(元/人) X7 居住支出(元/人)
X4 医疗保健支出(元/人) X8 杂项商品和服务支出(元/人)
辽宁 浙江 河南 甘肃 青海
X1 1772.14 2752.25 1386.76 1552.77 1711.03
X2 568.25 569.95 460.99 517.16 458.57
X3 298.66 662.31 312.97 402.03 334.91
X4 352.20 541.06 280.78 272.44 307.24
X5 307.21 623.05 246.24 265.29 297.72
X6 490.83 917.23 407.26 563.10 495.34
X7 364.28 599.98 547.19 302.27 274.48
X8 202.50 354.39 188.52 251.41 306.45
例3-5
x1 人均粮食支出 (元/人) x5 人均衣着支出 (元/人) x2 人均副食支出 (元/人) x6 人均日用杂品支出 (元/人) x3 人均烟、酒、饮料支出 (元/人) x7 人均水电燃料支出 (元/人) x4 人均其他副食支出 (元/人) x8 人均其他非商品支出 (元/人) 北 京 天 津 河 北 山 西 内蒙古 辽 宁 x1 21.30 21.50 18.25 21.84 21.37 22.74 x2 124.89 122.39 90.21 66.38 67.08 115.88 x3 35.43 29.08 24.45 18.05 20.28 28.21 x4 73.98 51.64 32.44 31.32 35.27 42.44 x5 93.01 55.04 62.48 74.48 81.07 58.07 x6 20.58 11.30 7.45 8.19 10.94 9.63 x7 43.97 54.88 47.50 34.97 39.46 48.65 x8 433.73 288.13 178.84 177.45 182.20 194.85 13
吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆 20.22 21.33 21.13 18.61 19.96 19.61 25.56 18.75 18.27 19.07 18.76 20.25 23.68 18.70 16.16 18.18 18.53 18.33 22.30 29.67 20.03 18.68 20.33 19.75 21.03 88.94 75.50 168.69 122.51 142.24 107.13 171.65 104.68 88.34 73.18 102.67 104.45 173.30 131.35 139.92 120.39 109.95 92.43 99.08 146.90 70.75 72.74 75.64 70.24 78.55 18.54 14.00 40.81 27.07 43.33 32.85 22.30 15.55 19.07 18.01 21.87 20.72 17.43 11.69 12.98 26.18 21.49 25.38 33.36 64.51 19.75 23.72 20.88 18.67 14.35 35.63 29.56 70.12 42.50 50.74 35.77 40.53 35.61 43.19 29.38 30.47 38.15 43.59 32.06 23.58 37.94 33.04 32.19 32.01 54.36 34.95 38.69 33.86 36.71 34.33 65.72 69.29 74.32 63.47 101.77 61.34 57.13 51.80 72.98 64.51 64.33 62.98 53.66 41.54 24.87 68.16 50.98 56.32 52.06 86.10 53.29 62.41 53.81 61.75 64.98 8.81 8.24 15.46 15.38 12.92 7.53 12.60 11.18 12.59 8.91 11.99 12.67 16.86 10.84 10.76 11.64 10.88 14.00 7.04 14.77 10.55 9.65 10.06 10.08 9.83 50.29 42.08 50.90 36.14 53.44 34.60 54.03 36.27 42.16 38.14 42.14 39.16 65.02 42.77 32.35 38.48 33.96 38.57 32.85 32.19 38.20 35.26 32.82 40.26 33.87 186.52 165.90 422.74 240.92 394.55 142.23 225.08 142.72 200.18 155.45 168.17 213.56 385.94 178.51 144.21 246.37 183.85 144.82 190.04 193.10 189.41 170.12 171.32 165.22 161.67
第4章
[例4-1] 判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(Iris Data)。鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。该数据给出150个鸢尾花的萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)、花瓣宽(petal width)以及这些花分别属于的种类(Species)等共五个变量。萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。这里三种鸢尾花各有50个观测值。数据格式如下图所示:
14
定义新的变量y为被解释变量,用“1”代表Setosa鸢尾花,用“2”代表Versicolour鸢尾花,用“3”代表Virginica鸢尾花,将萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽(petal width)四个变量作为解释变量。
使用SPSS软件中的Analyze→Classify→Discriminant,就进入了判别分析的对话框。分组变量(Grouping Variable)选择y,然后定义y的区域,最小值是1,最大值是3。解释变量(Independents)选择sepal.length、sepal.width、petal.length和petal.width。
统计量(Statistics)选项中选择描述统计量Means,Univariate ANOVAs和Box?M ,函数选择Fisher和非标准化函数,矩阵选择Within-groups correlation。分类(Classify)选项中选择
15
先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是50种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewise results),综合表(Summery Table)和“留一个在外”(Leave-one-out classifation)的验证原则,协方差矩阵选择Within-groups,作图选择Combined-groups。
保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。如果采用逐步判别法,我们还可以选择判别的方法(Method)。得到分析结果如下:
输出结果4-1
16
Discriminant
Analysis Case Processing SummaryUnweighted CasesValidExcludedMissing or out-of-rangegroup codesAt least one missingdiscriminating variableBoth missing orout-of-range groupcodes and at least onemissing discriminatingvariableTotalTotalN15000Percent100.0.0.0(1)
00150.0.0100.0
Group StatisticsStd.Deviation.3525.3791.1737.1054.5162.3138.4699.1978.6359.3225.5519.2747.8281.43591.7653.7622Valid N (listwise)UnweightedWeighted5050.0005050.0005050.0005050.0005050.0005050.0005050.0005050.0005050.0005050.0005050.0005050.000150150.000150150.000150150.000150150.000品种setosaversicolorvirginicaTotal萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽Mean5.0063.4281.462.2465.9362.7704.2601.3266.5882.9745.5522.0265.8433.0573.7581.199(2)
Tests of Equality of Group Means萼长片萼片宽花瓣长花瓣宽Wilks' Lambda.381.599.059.071F119.26549.1601180.161960.007df12222df2147147147147Sig..000.000.000.000(3)
输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。第1张表反映的是有效样本量及变量缺失的情况。第2张表是各组变量的描述统计分析。第3张表是对各组均值是否相等的检验。由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽(petal width)在三组的均值相等的假设,即认为变量萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽
17
(petal width)在三组的均值是有显著性差异的。
输出结果4-2
Box's Test of Equality of Covariance Matrices
Log DeterminantsLog品种RankDeterminantsetosa4-13.067versicolor4-10.874virginica4-8.927Pooled within-groups4-9.959The ranks and natural logarithms of determinantsprinted are those of the group covariance matrices.(1)
Test Results146.663Approx.7.045df120df277566.751Sig..000Tests null hypothesis of equalpopulation covariance matrices.Box's MF(2)
输出结果4-2是对各组协方差矩阵是否相等的Box?M检验。第1张表反映协方差矩阵的秩和行列式的对数值。由行列式值可以看出协方差矩阵不是病态矩阵。第2张表是对各总体协方差阵是否相等的统计检验。由F值及其显著水平,我们在0.05的显著性水平下拒绝原假设(原假设假定各总体协方差阵相等)。因此,在分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著差异。如果存在显著差异就应该采用Separate-groups协方差矩阵,反之,就用Within-groups协方差矩阵。
输出结果4-3
Summary of Canonical Discriminant Functions
EigenvaluesFunctionEigenvalue% of VarianceCumulative ?32.19299.199.1a2.285.9100.0a. First 2 canonical discriminant functions were used in theanalysis.CanonicalCorrelation.985.471(1)
18
Wilks' LambdaTest of Function(s)1 through 22Wilks' Lambda.023.778Chi-square546.11536.530df83Sig..000.000(2)
输出结果4-3分析的是典型判别函数。第1张表反映判别函数的特征值、解释方差的比例和典型相关系数。第一判别函数解释了99.1%的方差,第二判别函数解释了0.9%的方差,两个判别函数解释了全部方差。第2张表是对两个判别函数的显著性检验。由Wilks? Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。 输出结果4-4
Standardized CanonicalDiscriminant Function CoefficientsFunction12(1)
萼长片-.427.012萼片宽-.521.735花瓣长.947-.401花瓣宽 .575.581
Structure MatrixFunction12花瓣长.706*.168萼片宽-.119.864*花瓣宽.633.737*萼长片.223.311*Pooled within-groups correlations betweendiscriminating variables and standardizedcanonical discriminant functions Variables ordered by absolute size of correlationwithin function.*. Largest absolute correlation between each variable and any discriminant function
Canonical Discriminant Function CoefficientsFunction12萼长片-.829.024萼片宽-1.5342.165花瓣长2.201-.932花瓣宽2.8102.839(Constant)-2.105-6.661 Unstandardized coefficients
(2)
(3)
19
Functions at Group CentroidsFunction12-7.608.2151.825-.7285.783.513Unstandardized canonical discriminantfunctions evaluated at group means品种setosaversicolorvirginica(4)
输出结果4-4显示的是判别函数、判别载荷和各组的重心。第1张表是标准化的判别函数,表示为
y1??0.427Sepal.Length*?0.521Sepal.Width*?0.947Petal.Length*?0.575Petal.Width*y2?0.012Sepal.Length?0.735Sepal.Width?0.401Petal.Length?0.581Petal.Width*****,
这里表示标准化变量,标准化变量的系数也就是前面讲的判别权重。第2张表是结构矩阵,即判别载荷。由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。第3张表是非标准化的判别函数,表示为
y1??2.105?0.829Sepal.Length?1.534Sepal.Width?2.201Petal.Length?2.810Petal.Widthy2??6.661?0.024Sepal.Length?2.165Sepal.Width?0.932Petal.Length?2.839Petal.Width我们可以根据这个判别函数计算每个观测的判别Z得分。第4张表是反映判别函数在各组的重心。根据结果,判别函数在y?1这一组的重心为(-7.608,0.215),在y?2这一组的重心为(1.825,-0.728),在y?3这一组的重心为(5.783,0.513)。这样,我们就可以根据每个观测的判别Z得分将观测进行分类。
输出结果4-5
Classification Statistics
Classification Processing SummaryProcessedExcluded150Missing or out-of-rangegroup codesAt least one missingdiscriminating variable00150(1)
Used in Output
Prior Probabilities for GroupsCases Used in AnalysisUnweightedWeighted5050.0005050.0005050.000150150.000品种setosaversicolorvirginicaTotal
Prior.333.333.3331.000(2)
20
Classification Function Coefficients品种setosaversicolorvirginica萼长片23.54415.69812.446(3)
萼片宽23.5887.0733.685花瓣长-16.4315.21112.767花瓣宽-17.3986.43421.079(Constant)-86.308-72.853-104.368 Fisher's linear discriminant functions
Classification Resultsb,cPredicted Group Membership品种setosaversicolorvirginicaTotalOriginalCountsetosa500050versicolor048250virginica014950%setosa100.0.0.0100.0versicolor.096.04.0100.0virginica.02.098.0100.0Cross-validatedaCountsetosa500050versicolor048250virginica014950%setosa100.0.0.0100.0versicolor.096.04.0100.0virginica.02.098.0100.0a. Cross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from all casesother than that case.b. 98.0% of original grouped cases correctly classified.c. 98.0% of cross-validated grouped cases correctly classified.
4)
21
( (5)
输出结果4-5是分类的统计结果。第1张表概括了分类过程,说明150个观测都参与分类。第2张表说明各组的先验概率,我们在Classify选项中选择的是所有组的先验概率相等。第3张表是每组的分类函数(区别于判别函数),也称费歇线性判别函数,由表中的结果可以说明,
y?1这一组的分类函数是
f1??86.308?23.544Sepal.Length?23.588Sepal.Width?16.431Petal.Length?17.398Petal.Widthy?2这组的分类函数是
f2??72.853?15.698Sepal.Length?7.073Sepal.Width?5.211Petal.Length?6.434Petal.Widthy?3这组的分类函数是
f3??104.368?12.446Sepal.Length?3.685Sepal.Width?12.767Petal.Length?21.079Petal.Width。我们可以计算出每个观测在各组的分类函数值,然后将观测分类到较大的分类函数值中。第4张表是分类矩阵表。Predicted Group Membership表示预测的所属组关系,Original表示原始数据的所属组关系,Cross-validated表示交叉验证的所属组关系,这里交叉验证是采用“留
22
一个在外”的原则,即每个观测是通过除了这个观测以外的其他观测推导出来的判别函数来分类的。由第4张表可以看出,通过判别函数预测,有147个观测是分类正确的,其中,y?1组50个观测全部被判对,y?2组50个观测中有48个观测被判对,y?3组50个观测中有49个观测被判对,从而有147/150=98%的原始观测被判对。在交叉验证中,y?1组50个观测全部被判对,y?2组50个观测中有48个观测被判对,y?3组50个观测中有49个观测被判对,从而交叉验证有147/150=98%的原始观测被判对。还可以通过分类结果分析判对和判错的百分比。第(5)为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolour鸢尾花和Virginica鸢尾花可以很清晰的区分开,而Versicolour鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。
我们还可以通过保存(Save)选项选择预测的类别关系和判别得分等,对观测进行诊断。 由前面分析我们发现,协方差矩阵不等,可以考虑采用Separate-groups协方差矩阵,选择Separate-groups协方差矩阵,其他选择同上,得分类结果表如下:
输出结果4-6
aClassification ResultsOriginalCount%品种setosaversicolorvirginicasetosaversicolorvirginicaPredicted Group Membershipsetosaversicolorvirginica500004730149100.0.0.0.094.06.0.02.098.0Total505050100.0100.0100.0(1)
a. 97.3% of original grouped cases correctly classified.
23
(2)
由第1张表可以看出,通过判别函数预测,有146个观测是分类正确的,其中,y?1组50个观测全部被判对,y?2组50个观测中有47个观测被判对,y?3组50个观测中有49个观测被判对,从而有146/150=97.3%的原始观测被判对。第(2)为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolour鸢尾花和Virginica鸢尾花可以很清晰的区分开,而Versicolour鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。
由输出结果4-6可以看出,采用Separate-groups协方差矩阵与采用Within-groups协方差矩阵的预测效果没有明显的差别,因此,可以采用Within-groups协方差矩阵来进行判别。 例4-2 距离判别案例。为了研究2008年全国各地区城镇居民家庭人均消费支出情况,按人均收入、人均GDP以及消费支出将29个省、市、自治区(除天津和陕西以外)分为三种类型,设置group变量取值分别为1、2、3。试建立判别函数,判定天津、陕西分别属于哪个消费水平类型。判别指标及原始数据见表4-1。
解:本例中组数k=3,判别指标p=8,各组中样本为:n1?5,n2?13,n3?11,待判样品个数为2。
总体协差阵的逆矩阵:
24
??1??8.56 6.63 5.42 -1.48 -0.45 -11.59 -2.22 -7.19 ??6.63 47.51 14.73 13.67 -19.15 -4.24 -12.94 -40.50 ????5.42 14.73 51.26 -4.49 -21.81 -19.12 -1.93 -12.01 ???-1.48 13.67 -4.49 150.71 -7.74 11.18 -53.22 -22.70 ???10?6 ?-0.45 -19.15 -21.81 -7.74 49.96 14.99 -13.57 6.11 ????-11.59 -4.24 -19.12 11.18 14.99 38.95 -18.99 -12.95 ??-2.22 -12.94 -1.93 -53.22 -13.57 -18.99 53.46 -4.82 ?????-7.19 -40.50 -12.01 -22.70 6.11 -12.95 -4.82 198.48 ??
表4-1 2008年31个省、市、自治区农村居民家庭平均每人生活消费支出 x1 人均食品支出 (元/人) x5 人均交通和通信支出 (元/人)
x2 人均衣着支出 (元/人) x6 人均文教娱乐用品及服务支出(元/人)
x3 人均住房支出 (元/人) x7 人均医疗保健支出 (元/人)
x4 人均家庭设备及服务支出 (元/人) x8 其他商品及服务支出 (元/人) 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
地区 x1 x2 x3 x4 x5 x6 x7 x8 Group 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 25
上 海 7108.62 1520.61 1646.19 1182.24 755.29 3373.19 2874.54 937.21 广 东 5866.91 975.06 1748.16 947.54 836.39 2623.08 1936.38 594.45 北 京 5561.54 1571.74 1286.32 1096.57 1563.1 2293.23 2383.52 704.24 浙 江 5522.56 1546.46 1333.69 713.31 933.11 2392.63 2195.58 520.95 江 苏 4544.64 1166.91 1042.1 813.45 794.63 1357.96 1799.75 458.1 福 建 5078.85 1105.31 1300.1 722.17 540.63 1777.06 1453.18 523.83 重 庆 4418.34 1294.3 1096.82 842.09 878.25 1044.36 1267.03 305.6 云 南 4272.29 1026.5 739.2 331.94 606.86 1216.46 732.95 150.42 西 藏 4262.77 1011.82 634.94 310.22 317.08 966.74 419.59 400.38 四 川 4255.48 1042.45 819.28 590.51 564.93 1121.45 947.01 338.03 海 南 4226.9 491.84 1106.39 565.51 536.4 1303.5 930.87 247.08 广 西 4082.99 772.28 891.33 603.84 529.36 1376.03 1081.54 290.04 湖 北 3996.27 1099.16 914.26 604.4 675.32 890.12 1037.24 260.74 湖 南 3970.42 1090.72 960.82 674.84 790.95 971.05 1110.11 376.62 安 徽 3905.05 1010.61 988.12 579.59 633.93 920.77 1160.14 325.82 山 东 3699.42 1394.11 1247.04 806.35 799.79 1410.45 1277.43 372.01 江 西 3633.05 969.58 851.15 623.17 483.96 872.57 945.99 337.91 贵 州 3597.94 851.5 836.54 525.7 471.39 871.15 934.73 260.27 辽 宁 4378.14 1187.41 1270.95 507.4 913.13 1295.7 1145.46 533.29 内蒙古 3553.48 1616.56 1028.19 672.64 869.71 1191.7 1383.53 512.81
湖南(18) 广东(19) 广西(20) 四川(21) 贵州(22) 云南(23) 陕西(24) 甘肃(25) 青海(26) 宁夏(27) 新疆(28)
104.03 136.44 100.72 84.73 59.05 73.72 78.02 59.62 51.66 52.95 60.29
21.47 23.64 22.04 14.35 14.48 21.91 13.13 14.07 8.32 8.25 11.26
21.28 20.83 20.9 14.17 14.35 22.7 12.57 16.24 8.26 8.82 13.14
20.63 17.33 21.88 16.93 24.53 29.72 16.83 23.59 16.11 15.57 18.68
8.72 7.85 9.67 7.96 8.09 9.38 9.19 11.34 7.05 6.58 8.39
1272 2959 1732 1310 1068 1447 1731 926 1055 834 1041
1.98 3.71 2.13 2.34 1.32 1.94 2.08 1.13 1.31 1.12 2.9
13161 16259 12441 11703 9710 12517 11369 13084 9246 10406 10983
309 334 296.4 242.5 206.7 295.8 220.3 246.8 176.49 245.4 266
例5-3
厂家编号及指固定资产资金利销售收入资金利标 利税率 税率 利税率 润率
1 琉璃河 16.68 26.75 31.84 18.4 2 邯郸 19.7 27.56 32.94 19.2 3 大同 15.2 23.4 32.98 16.24 4 哈尔滨 7.29 8.97 21.3 4.76 5 华新 29.45 56.49 40.74 43.68 6 湘乡 32.93 42.78 47.98 33.87 7 柳州 25.39 37.82 36.76 27.56 8 峨嵋 15.05 19.49 27.21 14.21 9 耀县 19.82 28.78 33.41 20.17 10 永登 21.13 35.2 39.16 26.52 11 工源 16.75 28.72 29.62 19.23 12 抚顺 15.83 28.03 26.4 17.43 13 大连 16.53 29.73 32.49 20.63 14 江南 22.24 54.59 31.05 37 15 江油 12.92 20.82 25.12 12.54
固定资流动资
产产值金周转万元产全员劳动生率 天数 值能耗 产率 53.25 55 28.83 1.75 59.82 55 32.92 2.87 46.78 65 41.69 1.53 34.39 62 39.28 1.63 75.32 69 26.68 2.14 66.46 50 32.87 2.6 68.18 63 35.79 2.43 6.13 76 35.76 1.75 59.25 71 39.13 1.83 52.47 62 35.08 1.73 55.76 58 30.08 1.52 61.19 61 32.75 1.6 50.41 69 37.57 1.31 67.95 63 32.33 1.57 51.07 66 39.18 1.83
第6章 数据
例6-3
北 京
天 津 石 家庄 太 原
x1 830.8 549.74 331.33 222.63
x2 38103630 40496103 11981505 5183200
x3 30671.14 34679 10008.48 15248.11
x4
127.4 15.38 8.07 2.43
x5 5925388 2045295 493429 333473
x6 64413910 18253200 10444919 6601300
31
呼和浩特 97.81 2407794 4155.1 2 205779 2554496 沈 阳 440.6 10643612 14635.74 7.3 810889 14229575 长 春 313.05 15115270 10891.98 6.94 459709 8313564 哈 尔 滨 454.52 7215089 9517.8 24.99 763600 11536951 上 海 1041.39 1.03E+08 63861 35.22 8992850 60546000 南 京 391.67 25093816 14804.68 7.62 1364788 11336202 杭 州 263.67 32025226 16815.2 8.36 1503888 14664200 合 肥 福 州 南 昌 济 南 郑 州 武 汉 长 沙 广 州 南 宁 海 口 成 都 贵 阳 昆 明 西 安 兰 州 西 宁 银 川 乌鲁木齐 大 连 宁 波 厦 门 青 岛 深 圳 重 庆 北 京 天 津 石 家 庄 太 原 呼和浩特 沈 阳 长 春160.18 205.43 195.46 297.21 249.72 474.98 205.83 493.32 167.99 76.05 386.23 165.27 205.34 312.88 175.54 105.13 79.2 142.94 297.48 168.81 83.74 329.96 122.39 753.92 x7 434.15 174.5 86.74 74.55 28.9 101.7 89.7 5348605 12889573 4149169 13185425 9270494 13344938 5339304 40178324 2083763 2025643 9700976 3569419 5809573 6386627 5215490 1148959 1464867 3110943 15468641 26302862 13201500 25588695 52451037 15889928 x8 10989365 3254148 1067432 945212 407963 1521548 1244167 4640.84 8250.39 4454.45 14354.4 7846.91 16610.34 10630.5 28859.45 5893.09 3304.4 28798.2 5317.55 12337.86 9392 5580.8 2037.15 2127.17 12754.02 21081.47 13797.38 3054.82 30552.6 6792.66 32450.2 x9 15 18 18 16 18 15 15 3.39 4.69 3.62 6.6 8.77 13.58 6.31 21.47 4.95 2.72 8.06 5.75 7.07 12.21 3.7 1.24 1.65 3.94 6.6 4.8 2.83 6.72 10.84 12.83 x10 17.3 7.99 7.23 5.06 3.81 9.32 11.87 358694 674522 314094 761054 658737 804368 598930 2747707 362435 122541 895752 403855 601101 648037 205660 84397 122605 409119 1105405 1394162 701456 1201398 2908370 1615618 x11 8.56 7.23 8.28 7.88 8.92 6.7 7.03 3592488 8762245 4828029 7583525 10484859 12855341 7048500 37273276 4514961 2843664 14944197 3449487 7085278 12105607 4683830 1749293 1930771 4203000 13101986 10596339 3971559 9084693 21994500 18965569 x12 44.94 17.45 21.56 20.58 26.58 28.36 18.75
32
哈 尔 滨
上 海 南 京 杭 州 合 肥 福 州 南 昌 济 南 郑 州 武 汉 长 沙 广 州 南 宁 海 口 成 都 贵 阳 昆 明 西 安 兰 州 西 宁 银 川 乌鲁木齐
大 连 宁 波 厦 门 青 岛 深 圳 重 庆
168.83 281.51 87.91 75.72 37.88 71.3 49.79 78.38 83.99 136.08 60.04 182.16 50.79 22.97 124.03 54.53 73.34 113.73 54.91 20.6 29.12 47.42 82.13 59.88 54.78 104.55 104.98 203.79
2102165 7686511 1950742 1867776 526577 1073262 692717 1256160 1137056 1868350 1019924 5247087 668976 340392 1894496 664234 1045469 1535896 740661 301364 393035 782873 1442215 1418635 1042111 1603305 3259900 2535070
14 19 16 17 17 18 17 19 19 17 18 17 18 20 17 16 15 15 15 17 15 19 14 17 20 15 21 21
12.75 14.57 9.06 8.93 14.11 9.65 7.37 7.77 10.11 6.87 10.09 11.16 9.91 5.09 8.95 9.37 15.33 7.32 10.33 11.47 9.26 22.89 13.79 9.88 15.5 14.78 114.91 4.94
6.34 12.92 12.13 6.5 15.72 7.9 7.67 10.62 7.63 4.16 9.1 12.76 9.32 7.07 10.17 3.11 4.49 4.48 6.3 4.92 10.43 6.49 6.24 6.81 8.15 11.41 47.29 4.24
18.51 19.11 136.72 23.19 28.74 31.6 23.98 19.54 17.77 8.34 29.1 178.76 35.12 15.79 25.59 105.35 23.33 8.82 11.22 14.2 40.21 20.53 40.21 17.65 26.44 35.78 177.62 10.8
第7章 数据
例7-2 序号 1 2 3 4 5 6
省份 北京 天津 河北 山西 内蒙古 辽宁 工资性收入 4524.25 2720.85 1293.50 1177.94 504.46 1212.20 家庭性收入 1778.33 2626.46 1988.58 1563.52 2223.26 2163.49 财产性收入 588.04 152.88 93.74 62.70 73.05 113.24 转移性收入 455.64 79.64 105.81 86.49 188.10 201.28 33
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 510.96 464.31 6159.70 2786.11 3238.77 1010.05 1650.65 1227.94 1437.57 853.95 941.64 1228.79 2562.39 907.36 473.06 1088.80 954.89 583.28 348.31 565.18 756.71 586.71 560.52 702.10 195.51 2395.50 2363.92 774.60 2124.97 2789.40 1499.25 2365.02 1786.41 2258.05 1913.66 2049.04 1713.97 1731.97 1516.36 2345.56 1541.48 1681.63 1153.36 1530.13 1187.13 1118.91 1263.42 1359.56 1561.94 2140.76 148.35 230.63 457.52 150.44 278.92 44.91 98.73 25.78 102.80 35.85 16.81 42.05 167.25 18.30 55.58 30.89 41.59 35.51 75.52 217.22 56.92 20.57 61.99 48.62 33.87 209.19 162.41 855.95 214.76 352.86 86.75 335.96 88.76 132.13 67.13 91.71 133.55 228.88 52.66 129.83 148.35 124.65 104.81 87.84 108.37 120.09 109.18 169.40 196.24 112.01 第8章 数据
例8-2城市竞争力与城市基础设施关系研究
基础设施是城市经济、社会活动的基本载体,是城市竞争力的重要组成部分。本例选取中国20个城市统计数据,对城市基础设施和竞争力间的关系进行典型相关分析。 表8-2 城市竞争力与城市基础设施数据
34
SAS软件程序如下: data city;
input y1-y4 x1-x6;
label y1='劳动生产率' y2='市场占有率' y3='居民人均收入' y4='经济增长率' x1='对外设施指数'
x2='对内设施指数' x3='百人电话数' x4='技术设施指数' x5='文化设施指数' x6='卫生设施指数'; cards;
45623.05 2.5 8439.0 16.27 1.03 0.42 50.0 2.15…… run;
proc cancorr data=city all
vp=infrastructure wp=competitive; var x1-x6; with y1-y4; run;
例8-3为了分析影响生猪养殖的原因,我们选取以下代表生猪生产的主要指标:Y1肉猪出栏头数(万头)、Y2生猪年底存栏头数(万头)、Y3猪肉产量(万吨)、Y4出口活猪数量(万头)。对生猪生产有影响的指标有:X1猪(毛重)生产价格指数(1977年为100)、X2粮食产量(万吨)、X3粮食零售价格指数(1977=100)、X4农村居民人均纯收入(元)、X5乡村总人口数(万人)、X6全国人均猪肉消费量(斤)。
年份 x1
猪(毛重)生产价
100)
x2 x3
粮食零售价格
数
(1977=100)
x4 x5 x6
全国人均猪肉消费量(斤)
y1 y2
格指数(1977年为粮食产量(万吨) 指
农村居民人均纯收乡村总人口数入(元)
(万人)
肉猪出栏头数生猪年(万头)
头数(
1978 1979
100.30 124.77
30476.50 33211.50
101.30 105.05
133.60 160.20
79014.00 15.34 79047.00 19.32
35
16110.00 18768.00
3
3
1980 1981 1982 1983 1984 1985 1986 1987 1988 127.77 128.02 128.15 127.77 130.45 157.97 164.93 195.60 294.58 32055.50 32502.00 35450.00 38727.50 40730.50 37910.80 39151.20 40473.30 39408.00 108.72 112.97 113.19 113.08 112.85 125.15 136.79 145.27 165.76 191.30 223.40 270.10 309.80 355.30 397.60 423.80 462.60 544.90 79565.00 22.31 79901.00 22.15 80174.00 23.51 80734.00 24.69 80340.00 26.03 80757.00 27.98 81141.00 28.82 81626.00 29.00 82365.00 29.82 19861.00 19495.00 20063.00 20661.00 22047.00 23875.20 25721.50 26177.00 27570.30 3
2
3
2
3
3
3
3
3
1989 325.51 40754.90 201.06 601.50 83164.00 31.12 29023.30 1990 302.40 44624.30 191.41 686.31 84138.00 29.00 30991.00 1991 292.11 43529.30 207.87 708.60 84620.00 34.88 32897.00 1992 310.52 44265.80 258.39 784.00 84996.00 36.44 35170.00 1993 355.54 45648.80 329.96 921.60 85344.00 28.30 37823.80 1994 549.67 44510.10 490.65 1221.00 85681.00 27.32 42103.20 1995 637.62 46661.80 659.43 1577.74 85947.00 27.82 48051.00 1996 651.64 50453.50 708.89 1926.10 85085.00 28.87 41225.20 1997 717.46 49417.10 652.89 2090.10 84177.00 26.84 46483.70 1998 594.77 51229.50 632.65 2162.00 83153.00 27.78 50215.10 1999 506.75 50838.60 609.87 2210.30 82038.00 29.61 51977.20 2000 507.76 46217.50 549.49 2253.42 80837.00 30.01 51862.30 2001 522.49 45263.70 557.74 2366.40 79563.00 29.30 53281.10 2002 512.04 45705.80 549.93 2475.60 78241.00 33.98 54143.90 2003 526.89 43069.50 562.03 2622.20 76851.00 34.21 55701.80 2004 594.54 46946.90 710.96 2936.40 75705.00 32.66 57278.50 2005 580.15 48402.20 720.92 3254.93 74544.00 35.82 60367.40 2006
525.56
49804.20
738.94
3587.04
73742.00 35.46
61207.30 2007 766.53 50160.30 786.23 4140.36 72750.00 31.58
56508.30
数据来源:中经网统计数据库、万方中国年鉴资源全文数据库、《中国统计年鉴2008,数据从1978年-2007年。
注:指标X1在中国统计年鉴里,2002年以前统一使用的是肥猪收购价格指数,但2002年以后改为猪(毛重)生产价格指数,两个阶段使用了不同的统计标准,但不影响问题的分析。 使用SAS/STAT软件中的CANCORR过程来完成典型相关分析。样本程序见下表: data pig; input X1-X6 Y1-Y4; cards; 100.30 30476.50 101.30 133.60 79014.00 15.34 16110.00 30129.00 975.30 246.28 … … … … run; proc cancorr data=pig all; var X1-X6;with Y1-Y4; run; 36 3
3
3
3
3
4
4
3
4
4
4
4
4
4
4
4
4
4
4
Data步创建了生猪养殖的数据的SAS数据集(名为pig),它有30个观测,10个变量。 proc cancorr表示调用典型相关程序,选项all表示输出所有的结果。 var 语句列出第一组变量的名字,with 列出第二组变量的名字。
[例8-2] 城市竞争力与城市基础设施关系研究。
基础设施是城市经济、社会活动的基本载体,是城市竞争力的重要组成部分。本例选取中国20个城市统计数据,对城市基础设施和竞争力间的关系进行典型相关分析。
表8-2(数据读者可在www.ruc-6sigma.com网《应用多元统计分析》第14章下载)城市竞争力与城市基础设施数据
SAS软件程序读者可在www.ruc-6sigma.com网《应用多元统计分析》第14章下载。 输出结果8-2
①变量间的相关性
37
变量:y1='劳动生产率' y2='市场占有率? y3='居民人均收入' y4='经济增长率' x1='对外设施指数? x2='对内设施指数' x3='百人电话数' x4='技术设施指数' x5='文化设施指数' x6='卫生设施指数
? 城市基础设施指标变量相关性相对较强的有: X1与X3,X4; X4与X5; X5与
X6的相关系数都超过了0.5.
? 城市竞争力变量相关性相对较强的有: Y1与Y3;
? 城市基础设施指标和城市竞争力变量相关性相对较强的有: Y1与X2 ,X3;Y2
与X1,X4,X5,X6;Y3与X2,X3;Y4与Y5。 典型相关系数、特征值及多变量检验 ②典型相关系数、特征值及多变量检验
? 样本第一组典型方程V1和W1的典型相关系数为:0.960103.第二组为:0.949937. ? 注意:这些典型相关系数是越来越小的。 ? 从4组典型方程的特征值看:第一、二组的特征值明显较大,其贡献分别为53.33%,
38
42.21%,累计贡献为96.04%。足以代表变量组间的相关。
? 从典型方程的显著性检验的P值看:在0.001甚至更小的显著性水平上,第一、二
组典型方程显著。表明能够用城市基础设施变量组来解释城市竞争力变量组。
③基础设施和竞争力变量在4条典型方程上的标准化系数
由上表可知,典型相关模型: 第一组典型模型
infrastructure1=0.1535x1+0.3423x2+0.4913x3+0.3372x4+0.1149x5+0.1419x6 competitive1=0.1395y1+0.7185y2+0.4270y3+0.0285y4
第二组典型模型
infrastructure2=0.2134x1+0.2637x2+0.3953x3-0.8690x4+0.2429x5-0.3856x6 competitive2=0.1322y1-0.7361y2+0.7720y3+0.0059y4
特别说明:标准化系数的性质与回归分析系数类似,但由于受到变量间相关的影响,并不能作为解释各个变量在典型方程上相对重要性的依据,但很多教材在这方面都存在失误。以标准化系数的大小来解释变量的相对重要性跟定时不妥的,除非各变量间不相关,而这又跟典型相关分析相悖。
另外需注意,SPSS的输出结果与SAS的结果,相关系数的符号恰好相反。
④各变量的典型负荷与跨典型负荷
39
X1-X4都与基础设施组的第一典型变量infrastructure1呈高度相关,相关系数均在0.6以上。说明对外基础设施、对内基础设施、百人电话数、技术设施指数在反应城市基础设施水平方面占主导地位。同时X1-X4与城市竞争力变量组的第一典型变量competitive1也呈高度相关。说明上述城市基础设施指标是反应城市竞争力大小的主要因素,X5和X6虽然对城市竞争力的影响相对较小,但其影响效应是正向的,这也与现实相符合。
Y1-Y3与竞争力变量组的第一典型变量competitive1呈高度相关,相关系数均在0.6以上。说明劳动生产率、市场占有率、居民人均收入在反应城市竞争力水平方面占主导地位。 同时Y1-Y3与城市基础设施变量组的第一典型变量infrastructure1也呈高度相关。体现了基础设施变量的主要因素对城市竞争力的本质影响,与指标的实际经济联系相吻合。 对第二组典型变量的结构解释与上类似,但由于第二组典型变量反应的信息量相对较小,故分析时主要看第一组典型变量。
抑制变量:如果出现变量的典型系数符号与典型相关系数符号相反的情况,则称此变量为抑制变量。由上述两个表格对比可知: 对于infrastructure2来讲,X1与X5为抑制变量。对于infrastructure1,没有抑制变量。
变量 X1 X2 + + X3 + + X4 - - X5 - + X6 - - 相关系数 - 典型系数 +
5典型冗余分析
40
SAS输出的第一组变量的变异量被4条infrastructure方程解释的百分比及与4条competitive典型方程的冗余系数。
由报表看:对于VAR组, infrastructure 1解释了本组变量变异值的51.59%;而competitive1能解释VAR组变量变异的47.55%.
注意:原始变量的冗余分析表只有在进行典型分析时,是以方差协方差矩阵取代相关矩阵,进行案例分析时才有意义。否则应看标准化的典型系数的相关报表。 6标准化变量的冗余分析
由报表看:对于基础设施变量组, infrastructure1解释了本组变量变异值的36.06%;而competitive1也能解释基础设施组变量变异的33.24%. infrastructure2解释了本组变量变异值的26.12%;而competitive2也能解释基础设施组变量变异的23.57%.其累计解释程度分别为:62.18%和56.81%。
同理,对于城市竞争力变量组,两个典型变量对竞争力变量变异的累计解释程度分别为:70.09%,64.04%。说明基础设施变量组和竞争力变量组相互解释能力较强。关系:第二典型冗余=第一典型冗余*典型相关系数的平方。
[例8-3] 为了分析影响生猪养殖的原因,我们选取以下代表生猪生产的主要指标:Y1肉猪出栏头数(万头)、Y2生猪年底存栏头数(万头)、Y3猪肉产量(万吨)、Y4出口活猪数量(万头)。对生猪生产有影响的指标有:X1猪(毛重)生产价格指数(1977年
41
为100)、X2粮食产量(万吨)、X3粮食零售价格指数(1977=100)、X4农村居民人均纯收入(元)、X5乡村总人口数(万人)、X6全国人均猪肉消费量(斤)。
数据读者可在www.ruc-6sigma.com网《应用多元统计分析》第14章下载。 数据来源:中经网统计数据库、万方中国年鉴资源全文数据库、《中国统计年鉴2008,数据从1978年-2007年。
注:指标X1在中国统计年鉴里,2002年以前统一使用的是肥猪收购价格指数,但2002年以后改为猪(毛重)生产价格指数,两个阶段使用了不同的统计标准,但不影响问题的分析。 使用SAS/STAT软件中的CANCORR过程来完成典型相关分析。样本程序见下表: data pig; input X1-X6 Y1-Y4; cards; 100.30 30476.50 101.30 133.60 79014.00 15.34 16110.00 30129.00 975.30 246.28 … … … … run; proc cancorr data=pig all; var X1-X6;with Y1-Y4; run; Data步创建了生猪养殖的数据的SAS数据集(名为pig),它有30个观测,10个变量。 proc cancorr表示调用典型相关程序,选项all表示输出所有的结果。 var 语句列出第一组变量的名字,with 列出第二组变量的名字。部分计算见输出结果8-3: 输出结果8-3: Correlations Among the VAR Variables X1 X2 X3 X4 X5 X6 X1 1.0000 0.8805 0.9633 0.8756 -0.0982 0.5379 X2 0.8805 1.0000 0.8613 0.7915 0.0300 0.6921 X3 0.9633 0.8613 1.0000 0.9390 -0.2639 0.5256 X4 0.8756 0.7915 0.9390 1.0000 -0.5262 0.6036 X5 -0.0982 0.0300 -0.2639 -0.5262 1.0000 -0.1327 X6 0.5379 0.6921 0.5256 0.6036 -0.1327 1.0000 Correlations Among the WITH Variables Y1 Y2 Y3 Y4 Y1 1.0000 0.9516 0.9982 -0.7665 Y2 0.9516 1.0000 0.9580 -0.6202 Y3 0.9982 0.9580 1.0000 -0.7369 Y4 -0.7665 -0.6202 -0.7369 1.0000 Correlations Between the VAR Variables and the WITH Variables Y1 Y2 Y3 Y4 X1 0.9065 0.9057 0.9156 -0.6423 X2 0.8588 0.8642 0.8780 -0.4928 X3 0.9478 0.8972 0.9466 -0.7745 X4 0.9511 0.8545 0.9409 -0.8579 X5 -0.3192 -0.1170 -0.2748 0.6768 X6 0.6887 0.6599 0.7011 -0.2556 42 The CANCORR Procedure Canonical Correlation Analysis Adjusted Approximate Squared Canonical Canonical Standard Canonical Correlation Correlation Error Correlation 1 0.987904 0.984801 0.004465 0.975955 2 0.916487 0.899610 0.029721 0.839948 3 0.762148 0.736296 0.077830 0.580870 4 0.244095 0.123398 0.174631 0.059583 Test of H0: The canonical correlations in the Eigenvalues of Inv(E)*H current row and all that follow are zero = CanRsq/(1-CanRsq) Likelihood Approximate Eigenvalue Difference Proportion Cumulative Ratio F Value Num DF Den DF Pr > F 1 40.5891 35.3411 0.8584 0.8584 0.00151688 16.05 24 70.982 <.0001 2 5.2480 3.8621 0.1110 0.9694 0.06308546 6.70 15 58.373 <.0001 3 1.3859 1.3225 0.0293 0.9987 0.39415704 3.26 8 44 0.0053 4 0.0634 0.0013 1.0000 0.94041748 0.49 3 23 0.6955
输出结果8-3列出了两组变量各指标之间的相关关系。有结果可以看出,X1与X3、X1与X4均有有较高的相关系数,说了这几个指标在很大程度上都是影响生猪养殖的指标,且指标间包含的信息有重叠的部分。另外,Y1与Y2、Y2与Y3之间的相关系数也较高,它们可以反映生猪养殖的情况。 输出结果8-4
输出结果8-4给给出了典型相关相关系数及个相关系数的检验。第一对典型变量的典型相关系数为0.987904,第二对典型变量的典型相关系数为0.916487。检验结果表明两个典型系数均是显著的。因此,两组变量相关性的研究可以转化为研究第一对和第二对典型变量的相关性。
输出结果8-5
The CANCORR Procedure Canonical Correlation Analysis Standardized Canonical Coefficients for the VAR Variables V1 V2 V3 V4 X1 -0.5619 0.8970 0.4774 -1.5071 X2 -0.2882 0.2028 0.2887 2.7474 X3 0.3725 -1.5061 2.8455 -0.8289 X4 1.5623 0.6221 -5.3347 -0.0088 X5 0.5460 0.9031 -1.9598 -0.6186 X6 0.1113 0.2346 1.5978 -0.6004 Standardized Canonical Coefficients for the WITH Variables W1 W2 W3 W4 Y1 -0.5005 -9.8843 20.0432 -14.3389 Y2 -0.1387 0.8085 -2.3337 -3.0278 Y3 1.5230 9.5616 -15.9830 16.8028 Y4 -0.1418 0.5254 2.3860 -0.4936 43
The CANCORR Procedure Canonical Structure Correlations Between the VAR Variables and Their Canonical Variables V1 V2 V3 V4 X1 0.9173 0.2070 -0.1466 -0.1564 X2 0.8679 0.3774 -0.0158 0.2653 X3 0.9644 0.0017 -0.0982 -0.0751 X4 0.9718 -0.1798 -0.0205 0.0309 X5 -0.3427 0.8602 -0.1539 -0.0849 X6 0.6759 0.3215 0.5903 0.1315 Correlations Between the WITH Variables and Their Canonical Variables W1 W2 W3 W4 Y1 0.9965 0.0271 0.0391 -0.0686 Y2 0.9320 0.2370 -0.0525 -0.2692 Y3 0.9950 0.0821 0.0312 -0.0477 Y4 -0.7944 0.5542 0.2484 -0.0071 Correlations Between the VAR Variables and the Canonical Variables of the WITH Variables W1 W2 W3 W4 X1 0.9062 0.1897 -0.1117 -0.0382 X2 0.8574 0.3459 -0.0120 0.0648 X3 0.9527 0.0016 -0.0749 -0.0183 X4 0.9600 -0.1648 -0.0156 0.0075 X5 -0.3385 0.7883 -0.1173 -0.0207 X6 0.6677 0.2947 0.4499 0.0321 Correlations Between the WITH Variables and the Canonical Variables of the VAR Variables V1 V2 V3 V4 Y1 0.9845 0.0248 0.0298 -0.0167 Y2 0.9207 0.2172 -0.0400 -0.0657 Y3 0.9830 0.0752 0.0238 -0.0116 Y4 -0.7848 0.5079 0.1893 -0.0017 输出结果8-4和输出结果8-5是典型系数和典型结构的分析。 前两对典型变量的线性组合是:
V1?-0.5619X1 -0.2882X2? 0.3725X3? 1.5623X4?0.5460X5?0.1113X6 W1? -0.5005Y1 -0.1387Y2? 1.5230 Y3-0.1418 Y4
在第一对典型变量V1和W1中,V1是对生猪养殖有影响的各因素的线性组合。可以看出V1主要代表X1猪(毛重)生产价格指数、X4农村居民人均纯收入、X5乡村总人口数。 W1是对生猪养殖指标的线性组合。W1主要代表Y1肉猪出栏头数、Y3猪肉产量.
这说明肉猪出栏头数、猪肉产量与(毛重)生产价格指数、农村居民人均纯收入、乡村总人口数有较密切的关系。
V2? 0.8970X1? 0.2028X2 -1.5061X3? 0.6221X4? 0.9031 X5? 0.2346X6 W2? -9.8843Y1? 0.8085Y2? 9.5616Y3? 0.5254Y4
在第二对典型变量V2和W2中,在V2的线性组合中与 X1猪(毛重)生产价格指数、X3粮食零售价格指数、X4农村居民人均纯收入、X5乡村总人口数的载荷系数较大,不过X3粮食零售价格指数在这里起副作用。W2的线性组合中与Y1肉猪出栏头数、Y2生猪年底存栏头数、Y3猪肉产量的载荷系数较大。这说明了猪(毛重)生产价格指数、粮食零售价格指数、农村居民人均纯收入、乡村总人口数是农民养猪的主要因素。从第二对典型变量中进一步看出生猪年底存栏头数与猪(毛重)生产价格指数及粮食产量同方向增长,与粮价方向相反。输出结果8-5
44
可以看出V1与指标X1、X2、X3、X4有较强的相关性。W1与指标Y1、Y2、Y3有较强的相关性。 这些情况表明年底存栏头数是农民养猪积极性的反映。而农民养猪成本受粮食价格的制约,粮食产量下降,粮食价格升高、饲料必然上涨,人民养猪的成本投入增大,养猪利润较少,农民致富的经营目标当然转移,只是商品生产的必然规律,改革开放初期我国生猪养殖的波动已充分说明了这方面的问题。但近几年政府相继出台生猪养殖的各项好政策,落实对养猪户的补贴政策,以维护生猪养殖的稳定发展。 输出结果8-6 The CANCORR Procedure Canonical Redundancy Analysis Standardized Variance of the VAR Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Canonical Variable Cumulative Canonical Cumulative Number Proportion Proportion R-Square Proportion Proportion 1 0.6739 0.6739 0.9760 0.6577 0.6577 2 0.1768 0.8507 0.8399 0.1485 0.8062 3 0.0673 0.9180 0.5809 0.0391 0.8453 4 0.0210 0.9390 0.0596 0.0013 0.8466 Standardized Variance of the WITH Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Canonical Variable Cumulative Canonical Cumulative Number Proportion Proportion R-Square Proportion Proportion 1 0.8707 0.8707 0.9760 0.8498 0.8498 2 0.0927 0.9634 0.8399 0.0779 0.9276 3 0.0167 0.9801 0.5809 0.0097 0.9373 4 0.0199 1.0000 0.0596 0.0012 0.9385
45
输出结果8-7 The CANCORR Procedure Canonical Redundancy Analysis Squared Multiple Correlations Between the VAR Variables and the First M Canonical Variables of the WITH Variables M 1 2 3 4 X1 0.8213 0.8573 0.8697 0.8712 X2 0.7351 0.8547 0.8549 0.8590 X3 0.9077 0.9077 0.9133 0.9137 X4 0.9217 0.9488 0.9491 0.9491 X5 0.1146 0.7361 0.7498 0.7502 X6 0.4458 0.5327 0.7350 0.7361 Squared Multiple Correlations Between the WITH Variables and the First M Canonical Variables of the VAR Variables M 1 2 3 4 Y1 0.9692 0.9698 0.9707 0.9709 Y2 0.8477 0.8949 0.8965 0.9008 Y3 0.9662 0.9719 0.9724 0.9726 Y4 0.6159 0.8739 0.9098 0.9098
输出结果8-6和输出结果8-7是典型冗余分析。输出结果说明典型函数可以解释的变量方差的比例。第一典型变量V1可以解释组内变差67.39%,并解释的另一组(生猪养殖指标)的变差为65.77%;典型变量W1可以解释组内变差87.07%,并解释的另一组(生猪养殖的影响因素指标)的变差为84.98%。可见第一对典型变量都能较全面地预测另一组变量。而第二和第三对典型变量实际上都没给出较充分的信息。
输出结果8-7是典型冗余分析的复相关系数分析,类似于回归分析中的R,读者可试给出相应的解释。
利用SPSS软件也可以进行典型相关分析。有关SPSS典型相关分析的输出,本文不再详细讨论,有兴趣的读者请参考相关指导书。
2
第9章 数据
例9-1 高 中 低 合计 满意 53 434 111 598 不满意 38 108 48 194 合计 91 542 159 792 46
例9-2 序号 年家庭收 入(万元) x 1 2 3 4 5 6 7 8 9 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 签定意向 书人数 ni 25 32 58 52 43 39 28 21 15 实际购房 人数 mi 8 13 26 22 20 22 16 12 10 实际购房 比例 pi=mi/ni 0.320000 0.406250 0.448276 0.423077 0.465116 0.564103 0.571429 0.571429 0.666667 逻辑变换 pip?) i?ln(1?pi-0.75377 -0.37949 -0.20764 -0.31015 -0.13976 0.257829 0.287682 0.287682 0.693147 权重 wi=nipi(1-pi) 5.440 7.719 14.345 12.692 10.698 9.590 6.857 5.143 3.333 例9-3
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 性别 0 0 0 0 0 0 0 0 0 0 0 0 0 1 年龄 18 21 23 23 28 31 36 42 46 48 55 56 58 18 月收入 850 1200 850 950 1200 850 1500 1000 950 1200 1800 2100 1800 850 y 0 0 1 1 1 0 1 1 1 0 1 1 1 0 序号 15 16 17 18 19 20 21 22 23 24 25 26 27 28 性别 1 1 1 1 1 1 1 1 1 1 1 1 1 1 年龄 20 25 27 28 30 32 33 33 38 41 45 48 52 56 月收入 1000 1200 1300 1500 950 1000 1800 1000 1200 1500 1800 1000 1500 1800 y 0 0 0 0 1 0 0 0 0 0 1 0 1 1
第10章 数据
例10-2 分行号
不良贷款 1 2
贷款余额 应收贷款 项目数 6.80
固定资产投资额 5 16
51.90 90.90
47
0.90 1.10
67.30 111.30
19.80
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
4.80 3.20 7.80 2.70 1.60 12.50 1.00 2.60 0.30 4.00 0.80 3.50 10.20 3.00 0.20 0.40 1.00 6.80 11.60 1.60 1.20 7.20 3.20
173.00 80.80 199.70 16.20 107.40 185.40 96.10 72.80 64.20 132.20 58.60 174.60 263.50 79.30 14.80 73.50 24.70 139.40 368.20 95.70 109.60 196.20 102.20
7.70 7.20 16.50 2.20 10.70 27.10 1.70 9.10 2.10 11.20 6.00 12.70 15.60 8.90 0.60 5.90 5.00 7.20 16.80 3.80 10.30 15.80 12.00
17 10 19 1 17 18 10 14 11 23 14 26 34 15 2 11 4 28 32 10 14 16 10
73.70 14.50 63.20 2.20 20.20 43.80 55.90 64.30 42.70 76.70 22.80 117.10 146.70 22.90 42.10 25.30 13.40 64.30 163.90 44.50 67.90 39.70 97.10
第12章 数据
例12-1
水平 属性 1.从公寓到公司的坐车时间 2.公寓周围的噪音水平 3.公寓所在地的安全情况 4.公寓情况 5.居住/进餐房间大小 6.月租金(包括用具)
48
¥150-300 1 15分钟以内 非常安静 非常安全 全部刷新过 7/9米 ¥300-500 2 15-30分钟 一般 一般安全 仅厨房刷新过 5/7米 ¥500以上 3 30分钟以上 极其嘈杂 不安全 条件不好 3/5米
例12-2 品牌 方正 联想 惠普 内存容量/MB 256 512 1024 CPU/GHZ 2 3 4 单价/元 4200 7200 10039
第13章 数据
例13-3 项目 负债保障率 长期负债倍数 流动比率 资产利润率 收入利润率 成本费用利润率 净利润现金比率 三年资产平均增长率 三年销售平均增长率 三年平均资本增长率 宝钢 2.89 5.16 1.31 21.71 23.17 30.23 1.79 1.48 20.07 11.04 鞍钢 2.95 9.15 1.83 17.34 11.33 12.76 0.9 7.28 29.19 10.5 武钢 2.34 6.07 1.16 24.77 19.55 24.81 1.7 63.3 52.88 48.95 首钢 1.85 2.63 2.22 11.89 7.6 8.05 1.09 11.76 18.77 7.63 浦项 3.12 6.96 2.1 25.34 22.28 28.52 1.3 13.18 24.16 17.51
例13-4
净资产收总资产报资产负债总资产流动资产已获利息销售增长资本积累公司简称 益率% 酬率% 深能源A 深南电A 16.85 22 率% 周转率 周转率 1.78 倍数 率% 率% 54.54 19.41
12.35 42.32 0.37 15.30 46.51 0.76 7.18 45.73 48.11 1.77 15.67
第14章数据
例14-1 1 1 2 3 4 5 6 7 8 9 10 11 12 49
2 3 4 5 6 7 8 9 10 11 12 244 218 284 197 312 215 469 166 212 253 270 350 77 167 444 221 583 242 53 325 168 369 347 94 150 251 116 298 57 284 242 463 236 598 257 72 340 164 441 279 598 269 170 359 277 245 169 210 392 143 378 380 55 168 117 143 349 531 264 514 190 91 173 273 111 256
例14-7 城市 天津 北京 0 486 728 1033 1275 2210 1335 1630 1174 锦州 0 242 547 789 1724 849 1144 688 沈阳 0 305 547 1482 760 902 446 长春 0 242 1177 530 597 128 哈尔滨 0 935 288 355 275 满洲里 齐齐哈尔 牡丹江 吉林 0 693 1290 1210 0 643 563 0 630 0 天津 0 北京 137 锦州 499 沈阳 741 长春 1046 哈尔1288 滨 满洲2326 里 齐齐1451 哈尔 牡丹1746 江 吉林 1187 50
正在阅读:
《多元统计分析》第三版例题习题数据文件04-11
人教版七下导学案unit10SectionB(2a—2c)08-06
学术报告格式规范05-31
学习第十次党代会心得体会08-05
2004重庆市土地利用变化情况分析报告05-27
(教师典型例题专讲)2014届高三数学一轮提能一日一讲(11月6日04-20
红星国际星城31米高支模施工方案及计算书 - secret09-08
广西壮族自治区第十次党代会报告精神解读(满分卷五)10-12
中国木版年画的艺术12-21
关于晚自习迟到检讨书3篇08-13
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 例题
- 统计分析
- 习题
- 多元
- 文件
- 数据
- 2011年下半年客户经理岗位资格考试模拟试卷(福州分行)
- 持续改进控制程序(正文)
- 银联POS终端系统参数设置说明
- 东北大学材料加工复试题背诵版
- 《用业绩证明你的能力》读后感
- 关于我市乡风文明建设情况的调研报告
- 初中物理8年级(人教版)教学资源模板样例
- 大模板堆放区地下车库顶板承载力验算
- 儿童诗《鞋》教案
- 钢结构液压同步提升 - 图文
- 专题03 正确使用词语(包括熟语)-2014年高考语文考纲解读及热点
- 如果你看完你将收获100万
- 多元评价 学生乐学的
- ORACLE编程规范
- 中国阻焊油墨研究报告
- 论现代博物馆陈列布展设计
- 我的硕士路(2)
- 教育叙事之教育实习日记100篇
- 2012年“金钥匙”科技竞赛(初三学生CESL活动)决赛试题 有答案
- 第十三章 光单元检测