聚类分析(实验报告) - 图文

更新时间:2023-10-08 10:48:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

理学院数学与应用数学系课程实验报告 姓 名 课程名称 实验题目 班 级 应数1101 聚类分析 学 号 完成日期 2013.11.04 多元统计分析 指导教师 实验目的 熟悉并掌握适用于样品聚类的系统聚类法、动态聚类法以及相应的CLUSTER过程和FASTCLUS过程;适用于变量聚类的VARCLUS过程。 实验内容: 1、下表是第五次全国人口普查中得到的我国内地各省、市、自治区6岁以上人口受教育程度情况分布(单位:人,资料来源: 《中国统计年鉴2002》): 要求: (1) 采用Ward最小方差聚类法进行聚类分析。(要求对原始数据 标准化,不要求平方和为单位均方,且不用总离差平方和去除类间平房和得到平方半偏相关) (2) 用TREE过程绘制聚类过程图。(聚为4类,按类降序排列, 并分类打印输出,其中识别变量仍为地区名) (3) 采用动态聚类法进行聚类分析。 2、一组有关12盎司20种啤酒成分和价格的数据,分别用系统聚类法(距离用类平均距离)、动态聚类法,聚为4类,分别给出两种聚类方法的分类结果及各类均值。 啤酒名 Budweiser Schlitz Ionenbrau Kronensourc Heineken Old-milnaukee Aucsberger Strchs-bohemi Miller-lite Sudeiser-lich Coors Coorslicht Michelos-lich Secrs Kkirin Pabst-extra-l Heilemans-old Olympia-gold- Schlite-light 热量(卡) 钠含量 144 181 157 170 152 145 175 149 99 113 140 102 135 150 149 68 144 72 97 19 19 15 7 11 23 24 27 10 6 16 15 11 19 6 15 19 24 6 7 酒精含量 价格 4.7 4.9 4.9 5.2 5 4.6 5.5 4.7 4.3 3.7 4.6 4.1 4.2 4.7 5 2.3 4.4 4.9 2.9 4.2 0.43 0.43 0.48 0.73 0.77 0.26 0.4 0.42 0.43 0.44 0.44 0.46 0.5 0.76 0.79 0.36 0.43 0.43 0.46 0.47 Hamms 136 实验过程与方法: 第一题: 程序: data educate; input area$ illetera saomang primary junior senior zhuan dazhuan benke graduate; label area='地区' illetera='未上过学' saomang='扫盲班' primary='小学' junior='初中' senior='高中' zhuan='中专' dazhuan='大专' benke='本科' graduate='研究生'; cards;

beijing 581637 47255 2301726 4665166 2197285 946071 1029929 1082268 172653

tianjin 513821 52641 2468891 3405530 1261461 792843 506548 355426 24040

hebei 3746461 1391599 22135051 26099323 5317893 1845716 1241219 539833 18020

shanxi 1543364 367239 10319110 12637984 2659168 1103422 784075 314548 12452

neimeng 2186638 166045 7261714 8116632 2331910 881247 648891 234087 6851

liaoning 2117529 171572 12482572 16757863 3997787 1519869 1692445 845654 47251

jilin 1342416 189862 8997647 9567968 3057145 997198 813292 486979 21600

heilong 1968874 147023 11328284 14113200 3834472 1196355 1199694 517847 24013

shanghai 873696 216143 3106637 6038572 2665497 1111196 934083 784698 76188

jiangsu 4585521 1638610 24017994 26562474 7432762 2120420 1857521 946584 58165

zhejiang 3212522 1333150 16833356 15319423 3848613 1105013 955955 481679 30227

anhui 5937345 1553752 22043367 19367607 3084848 1430695 921539 425264 17108

fujian 2390826 687304 12875533 11437732 2442143 1186459 664183 331621 15927

jiangxi 2147384 732457 15660576 13455575 2946204 1039664 729694 306352 8713

shandong 7617518 1515741 29469811 32973455 6750446 3195988 2040572 921054 39126

henan 5428858 1500232 30321740 35919247 6935346 2271789 1817134 600731 21656

hubei 4321859 694959 21081800 20398435 5197580 2327881 1537447 729583 53623

hunan 2982232 676936 24219937 22593804 5123301 1949147 1314744 511717 25229

guangdo 3897970 764560 28224273 31261428 8181919 2836462 2046311 907391 77621

guangxi 1916084 572529 18432526 14218494 2787826 1426764 759650 275918 11566

hainan 581837 68032 2598636 2455575 707116 238707 167622 68398 4343

chongqi 2173652 373654 13229559 8993338 1897989 726047 555971 289664 14440

sichuan 6608326 1664134 35379826 24193763 4268063 2029776 1372692 629175 36787

guizhou 5256778 729043 15352997 7274827 1137569 859120 464897 205791 4178

yunnan 5157800 1430405 18979254 9018044 1657168 1131442 576877 263694 11988

xizang 1071534 149969 796442 165957 42418 50430 23255 9962 340

shananxi 2667730 609044 12178915 11707710 3307017 1061624 914224 539222 32597

gansu 3881068 670490 9280811 6017876 1818727 671874 467959 195449 9007

qinghai 1031333 155677 1489401 1035237 342581 150200 109100 46396 938

ningxia 659270 194625 1747141 1528464 426233 173640 136967 64438 1124

xinjiang 1227553 302613 6997824 5085927 1415358 832555 700996 239303 6162 ;

proc print;run;

goptions ftext=\宋体\;

proc cluster data=educate method=ward std nonorm pseudo outtree=educate1; var illetera saomang primary junior senior zhuan dazhuan benke graduate; id area; goptions vsize=12 hsize=8;

proc tree data=educate1 horizontal graphics n=4 out=wardeducate1 ;

copy area illetera saomang primary junior senior zhuan dazhuan benke graduate; title '使用WARD法的谱系聚类图'; run;

title '使用Ward法';

proc sort data=wardeducate1; by cluster; run;

proc print data=wardeducate1;

var cluster area illetera saomang primary junior senior zhuan dazhuan benke graduate; run;

Proc standard data=educate mean=0 std=1 out=educate2;

Var illetera saomang primary junior senior zhuan dazhuan benke graduate; proc fastclus data=educate2 out=educata3 maxc=4 list;

var illetera saomang primary junior senior zhuan dazhuan benke graduate;id area; run;

本文来源:https://www.bwwdw.com/article/7syf.html

Top