栅格分类方法详细介绍
更新时间:2024-06-09 13:54:01 阅读量: 综合文库 文档下载
- 栅格重分类推荐度:
- 相关推荐
没有进行过分类的地图,很难让人理解其表意。比如,以中共十八大的各省代表人数为例。 本届会议各省代表共计1556人,假若为每一个省(港澳台除外)单独设色,会是这样的效果,这样的地图让人不明其意,不知道各个省的代表人数到底几何。
常用的分类方法以ArcGIS提供的六种分类方法为例:Defined Interval、Equal Interval、Quantile、Standard Deviation、Natural Breaks(Jenks)、Geometry Interval(Geometry Interval是Esri自己开发的一种分类法,资料太少,这个就先不讨论),介绍下各种方法的原理、实现以及用途。
1. Equal Interval等距分类。
定义一个分类数,比如0~100的数据,分为4类,那么间隔就是25。间隔定了,那就和定义间隔分类的原理一致了。等距分类和上面的定义间隔分类原理简单,易于计算。比较适合用在温度、成绩和百分比等范围、间隔都为人熟知的数据。但是这两种分类法
可能会有“空类”(定义间隔也是的),比如0~100的数据,大部分都在0~50中,剩下的几个在90~100。如果你再按10为间隔去分类,那将会有4个空类!下图按等间隔分为4类
2.Defined Interval定义间隔分类。
定义一个间隔,比如0~100的数据,定义10为间隔,那么10,20?就是断点,分类数由间隔大小决定。
用Defined Interval分类,提供的信息不多,只能看出不同的省份落在了不同的区间而已,而这个区间的大小没有太大的实际意义。
3.Quantile等量分类。
又叫分位数分类,每一类的数目一样,这样就不会出现空类了。等量分类适合用于线性分布的数据,比如排名数据。但它不考虑数值大小,很可能将两个大小相近的值分到不同的类别中,也可能数据一样的数据,却分在不同的类中。
Quantile分类,每一类中的数目是相同的,也就是每一种颜色的省份个数一样,但它忽视了省份之间人数的差异。
4. Standard Deviation标准差分类。
显然适合正态分布的数据,用于表现与均值相异的程度。但涉及一点点统计知识,普通用户可能不好理解。
Standard Deviation分类可以看出黄色的省份人数适中(均值),而绿色就偏少了,红色最多。另外,这种分类法的图例与一般的不一样,原因是显而易见的。
5.Natural Breaks(Jenks)自然断点分类。
一般来说,分类的原则就是差不多的放在一起,分成若干类。统计上可以用方差来衡量,通过计算每类的方差,再计算这些方差之和,用方差和的大小来比较分类的好坏。因而需要计算各种分类的方差和,其值最小的就是最优的分类结果(但并不唯一)。这也是自然断点分类法的原理。另外,当你去看数据的分布时,可以比较明显的发现断裂之处(可以参看前文直方图),这些断裂之处和Natural Breaks方法算出来也是一致的。因而这种分类法很“自然”。
那Jenks又是谁?简单介绍下:
George F. Jenks (1916-1996),美国制图学家,生于纽约。41年本科毕业后加入陆军航空队,退伍后进入雪城大学深造,在Richard Harrison指导下学习制图。49年博士毕业后获堪萨斯大学教职,设计并执教制图学课程至退休。Jenks发明的Natural Breaks分类法是最常用的数据分类法,也是ArcGIS中的默认分类法。 Natural Breaks算法又有两种:
(1)Jenks-Caspall algorithm(1971),是Jenks和Caspall发明的算法。原理就如前所述,实现的时候要将每种分类情况都计算一遍,找到方差和最小的那一种,计算量极大。n个数分成k类,就要从n-1个数中找k-1个组合,这个数目是很惊人的。数据量较大时,如果分类又多,以当时的计算机水平根本不能穷举各种可能性。所以当时计算的得到的自然断点是看“运气”的!当然也有一些经验得来的评价指标。
(2)Fisher-Jenks algorithm(1977),Fisher(1958)发明了一种算法提高计算效率,不需要进行穷举(暂时还没看明白,文献也很少。等我弄明白了,再另写吧)。Jenks将这种方法引入到数据分类中。但后来者几乎只知道Jenks而不知Fisher了,难道是学地理的数学都太差的缘故: P。ArcGIS也是以这个算法为基础改进的,就是说还要更快!开源软件中也有些实现了,后面再说。
Natural Breaks分类可以很好地“物以类聚”,类别之间的差异明显,而类内部的差异是很小的,每一类之间都有一个明显的断裂之处。
6.比较与总结从直观上看
这份数据用Standard Deviation和Natural Breaks分类的效果较好,它们两个都考虑了数据分布的统计特征。而Equal(Defined) Interval和Quantile,仅仅是两种相对主观的分类法,不管是类间的距离还是类的数目,在这里都没有明确的标准。不像温度这样的数据,长久以来大家都有默认的区间,比如以10度为区间。这个比较还说明了一点,即相同的数据,用不
同分类方法,所表现的效果是截然不同的,特别是偏度很大或很小的数据。idvsolutions曾撰文讨论过,可参考。另外,如果要表示时序数据的时候,分类一定要确定,不能因为不同时刻不同数据有不同的分类。比如地图汇的这个气温变化例子,做得很好。不过有个小问题,就是图例的区间都是闭合且连续的。即上一个区间的终点和下一个区间的起点相同,那这个间断点到底应该属于哪一类呢?貌似地图汇暂时都是这样的处理。
正在阅读:
栅格分类方法详细介绍06-09
“以学案导学为载体、以小组合作为背景、以分层次自主学习为主要06-18
A320ME飞机放行人员考试04-28
二年级三位数进位退位减法练习题04-20
MOOC《汽车发动机》课程介绍片脚本05-15
教育督导促进校园文化建设的思考和实践06-14
2018高考语言得体练习题及答案04-07
电子标签(RFID)技术在图书馆中的应用06-09
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 栅格
- 方法
- 介绍
- 详细
- 分类
- 人民警察岗位执法资格等级化认证管理
- 中组部、人社部-关于进一步做好公务员登记工作的通知
- 大学英语(专升本)阶段性作业3
- 王闯:买卖合同纠纷审判实务若干问题
- 业务培训开班讲话
- 中国展示用品行业市场前景分析预测年度报告(目录) - 图文
- 湘教版小学美术二年级上册全册教案
- 华润雪花 - 功能设计 - OM-001 - 承运商车辆信息维护v1.0
- 教育系统自然灾害类突发公共事件应急预案
- 我怀着十分激动的心情向党组织提出申请
- 《儒林外史》名著阅读题
- 吴迪3+1选股法(内含通达信公式)
- 一站到底题目及答案最新最全
- 井下人员WIFI定位系统及其在煤矿安全生产中的应用
- 局组织人事科副科长竞聘演讲稿
- 安全教育案例分析
- 空白教师课程表
- Amazon培训之亚马逊全球开店绩效指标及常见问题
- PCBA检验标准
- 组胚期末重点分章题库