数据挖掘技术客户端毕业设计

更新时间:2024-04-20 07:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中 文 摘 要

题 目:数据挖掘技术在客户关系 管理中的研究与应用

摘 要

客户关系管理(CRM)是一种旨在改善企业与客户之间关系的管理机制,它通过提供优质和个性化的服务吸引和保持更多的客户。经过多年经营管理,企业拥有关于客户的大量数据,这些数据背后隐藏着许多重要的信息,而这些信息对企业决策的制定和生存发展有着至关重要的作用。那如何从大量的繁杂数据中提取有价值的信息呢?数据挖掘技术就是这样一种工具。它可以通过有关联分析、相关性分析、预测分析、聚类分析等挖掘出对企业有价值的信息,从而帮助企业经营管理者做出有助于改善与客户关系的决策,进一步促进企业的发展。

本文从客户关系管理的需求入手,在分析了数据挖掘的基本原理和技术后,介绍了数据挖掘技术在客户关系管理中应用的方法和步骤,并以在汽车销售行业决策树在客户分类方面的应用为例说明了数据挖掘技术在客户关系管理中的应用。

关键词:客户关系管理,数据挖掘技术,决策树,客户分类

I

Abstract

Customer Relationship Management(CRM) is a kind of new management system aiming at improving the relationship between corporations and their customers. It attracts and keeps more customers by providing superior quality and characteristic service. Running the corporation for manay years, the business enterprise hugs a great deal of data concerning customer, Which conceal many important informations, and these informations are very important for making decision and the development of the enterprise. But how does that withdraw a worthy information from the great quantities complicated data? Data Mining is a kind of tool according to the technique. It can pass relevant allied analysis, relativity analysis, predict analysis and gather a type of analysis etc to dig out worthy information for the business enterprise, helping the enterprise manager to make decisions which improve the relationship with customers, promote the development of business enterprise further.

This text related to the need of Customer Relationship Management(CRM) and analysis Data Mining’s applied method and the step in the customer relationship management after introducing basic principle and technique of Data Mining .Then take the application of decision tree in customer categorize in car selling field for example, briefly explained the application of Data Mining in the customer relationship management .

Key words: customer relationship management, data mining, decision tree, customer categorize

II

目 录

目 录

摘 要 ..................................................................................................................... I ABSTRACT ........................................................................................................... II 目 录 ................................................................................................................... III 第一章 引 言 ................................................................................................ - 1 - 1.1论文研究的背景 ........................................................................................- 1 - 1.2国内外研究的现状 ....................................................................................- 2 - 1.3研究内容、目的和意义 ............................................................................- 2 - 1.4本章小结 ....................................................................................................- 3 - 第二章 客户关系管理概述 ............................................................................ - 4 - 2.1 客户关系管理(CRM)的基本概念 .......................................................- 4 - 2.2 客户关系管理的重要作用 ........................................................................- 5 - 2.3 CRM的实现过程 .......................................................................................- 6 - 2.4 CRM的发展趋势及前景 ...........................................................................- 7 - 2.5本章小结 ....................................................................................................- 7 - 第三章 数据挖掘的基本理论 ........................................................................ - 8 - 3.1数据挖掘的概念 ........................................................................................- 8 - 3.2 数据挖掘的任务 ........................................................................................- 9 - 3.3数据挖掘的技术 ........................................................................................- 9 - 3.4数据挖掘的功能及作用 ..........................................................................- 10 - 3.5本章小结 ..................................................................................................- 11 - 第四章 数据挖掘技术在客户关系管理中的应用 ...................................... - 12 - 4.1数据挖掘与客户关系管理 ......................................................................- 12 - 4.2数据挖掘在客户关系管理中的功能 ......................................................- 13 - 4.3企业进行数据挖掘项目的方式 ..............................................................- 15 - 4.4在客户关系管理中应用数据挖掘的过程 ..............................................- 16 - 4.5本章小结 ..................................................................................................- 19 -

III

目 录

第五章 案例分析 .......................................................................................... - 20 - 5.1案例背景 ..................................................................................................- 20 - 5.2决策树方法用于客户分类 ......................................................................- 20 - 5.2.1数据准备及转化 ................................................................. - 20 - 5.2.2构造模型 ............................................................................ - 23 - 5.2.3结果分析 ............................................................................ - 27 - 5.3 本章小结 ..................................................................................................- 27 - 结 论 .............................................................................................................. - 28 - 参考文献 .......................................................................................................... - 29 - 致 谢 ................................................................................... 错误!未定义书签。

IV

第一章 引 言

第一章 引 言

1.1论文研究的背景

随着商品经济的发展,以客户为驱动的生产战略越来越受到国内企业的重视和认识。从宏观上来看,整个社会经济的发展己经进入了以“客户”、“竞争”、“变化”为主线的新经济时代。在这个时代,产品同质化的趋势越来越明显,竞争的焦点也已经从产品的功能、价格的竞争转向品牌、服务的竞争,最终转为客户资源的争夺。所以,企业如何与客户建立和保持一种长期、良好的合作关系?如何掌握客户资源、赢得客户信任?如何分析客户需求及价值,并在此基础上制定出企业发展战略和市场策略,生产出满足客户需要的产品和服务,将是企业核心竞争力的关键所在。说到底,客户关系管理(CRM)的实质就是通过供应链客户端的延伸,针对特定市场区段的客户来进行专门化的销售和服务,实现对客户资源的保值增值。现在CRM已成为业界最流行的术语。作为企业管理的新理念与新机制,CRM的研究与应用成为了全球最热衷的市场之一。

现在任何商业成功的一个关键因素是企业有效利用信息的能力。要利用数据作战略决策,就必须发现关于消费者、销售商和供应商那些隐藏的、以前未发现的和经常出现的极有价值的情况、行业趋势和方向及其他有意义的因素。了解这些信息,一个企业就可以系统地得出有效的商业、推销和销售策略;精确定位促销活动的目标;发现和了解新的市场;在商业竞争中获胜。但目前传统数据库所能做到的只是对数据库中的数据进行诸如录入、查询、统计等操作型处理,通过这种处理所获得的信息仅仅是数据库所包含的信息的一部分。缺乏对数据整体性的描述及其发展趋势预测方面的信息,无法发现数据中存在的关系和规则,再根据现有的数据预测未来的发展趋势,从而导致了\数据爆炸但知识贫乏\的现象。因此迫切需要一种能从大量数据中获取真正有价值信息、从信息中及时地发现知识的工具,这种新工具就是数据挖掘技术。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。虽然数据挖掘是一门新兴学科,但已在经济界显示出巨大的潜在价值。

- 1 -

第一章 引 言

1.2国内外研究的现状

随着数据挖掘技术的逐渐成熟以及信息技术的发展,国内外许多大的软件厂商已经把数据挖掘技术应用到客户关系管理软件当中,因为缺乏数据挖掘技术的客户关系管理软件已不是一个优秀的、完整的软件;而且数据挖掘技术的一个很重要应用环境就是数据库,以及在此基础上建立起来的数据仓库,现在很多大型的数据库例如Oracal,SQL server等都已经引入了数据挖掘技术,虽然要进行数据挖掘不一定非要在数据库中进行,但是在数据库给数据挖掘带来的便利以及成效是不容忽视的。

由于收集、维护数据需要巨大成本,所以在在收集并存储客户资料日益盛行的时候,已经有一些公司明确表示要放弃对详细的客户数据的收集工作,而且国内对B-C模式下定量的、动态的客户关系管理的研究几乎还是空白,而对客户进行管理离不开存储在企业各类客户(包括员工、消费者、合作伙伴等)身上的各种知识,所以,对B-C模式下的基于数据挖掘的动态客户关系管理的研究就显得异常迫切与重要。

1.3研究内容、目的和意义

本论文以数据挖掘技术在客户关系管理中的研究与应用为主要对象,在介绍了客户管理、数据挖掘技术之后,研究了数据挖掘技术在客户关系管理中应用的重要价值及主要步骤,最后以决策树在客户细分和线性回归在预测方面的应用为案例,说明了数据挖掘技术在客户关系管理中的应用过程。

本论文的研究目的是:使企业能够在客户关系管理中知道谁是客户、什么是客户的需要、客户需要什么样的产品和服务、如何才能满足客户的要求,以及满足客户要求的一些重要限制因素;还能观察和分析客户行为对企业收益的影响,使企业与客户的关系及企业盈利都得到最优化。使企业能够通过数据挖掘技术对市场和客户信息进行统计和分析,发现市场机会,确定目标客户群和营销组合,科学地制定出市场和产品策略。从而使数据挖掘技术能够发挥出它的商业价值。

- 2 -

第一章 引 言

CRM的良好应用前景会进一步加快数据挖掘技术的成熟和发展。在CRM中有效利用数据挖掘,可以指导企业高层决策者制定最优的企业营销策略,降低企业运营成本,增加利润,加速企业的发展。目前,国内外已经有众多的供应商正致力于CRM系统的开发之中。只有融合了数据挖掘技术的高效的客户关系管理才能更好地适应当今信息时代及其网络化特征,成为现代企业在激烈的市场竞争中生存的根本和制胜的关键。因此研究客户关系管理和数据挖掘的核心理论及其实际应用,对我国的客户关系管理的发展和企业信息化水平的提高有着重要的意义。

1.4本章小结

随着商品经济的发展,企业之间的竞争日趋激烈,以商品为主导的时代已经过去,客户资源的争夺成为现在竞争的关键。本章在讨论了本论文产生的北京后,研究了数据挖掘技术在客户关系管理中应用的现状以及进行此次论文研究的目的、方法和意义。将数据挖掘技术应用在客户关系管理领域,不仅对数据挖掘技术的研究有了进一步的推动,而且促进了企业管理理论和客户关系管理系统的发展,使一门新兴的技术体现了商业价值。

- 3 -

第二章 客户关系管理概述

第二章 客户关系管理概述

随着社会经济与管理理论的发展,企业对管理方法和技术越来越重视,而在企业管理中,又分许多方面,例如:人力资源管理、财务管理、库存管理、客户关系管理、销售管理、质量管理等等;所有的这一切都是以企业盈利为目的的,都是为了促进企业更好的发展,而这些方面都是相辅相成、互相联系的,那一方面做不好都会制约企业的发展,因为研究内容的关系,下面仅对客户关系管理做出介绍。

2.1 客户关系管理(CRM)的基本概念

CRM (Customer Relationship Management)就是客户关系管理。从字义上看,是指企业用CRM来管理与客户之间的关系。CRM的概念由美国Gartner集团率先提出。我们认为,CRM是辨识、获取、保持和增加“可获利客户”的理论、实践和技术手段的总称。它既是一种国际领先的、以“客户价值”为中心的企业管理理论、商业策略和企业运作实践,也是一种以信息技术为手段、有效提高企业收益、客户满意度、雇员生产力的管理体制。

CRM是一个获取、保持和增加可获利客户的方法和过程,也是企业利用信息技术和互联网技术实现对客户的整合营销,是以客户为核心的企业营销的技术实现和管理的实现。

CRM是一种技术手段,它的根本目的是通过不断改善客户关系、互动方式、资源调配、业务流程和自动化程度等,达到降低运营成本、提高企业销售收入、客户满意度和员工生产力。企业以追求最大赢利为最终目的,进行好客户关系管理是达到上述目的的手段,从这角度可以不加掩饰的说,CRM的应用是立足企业利益的,同时方便了客户,让客户满意。进而为企业带来长久增值和竞争力[1]。

- 4 -

第二章 客户关系管理概述

2.2 客户关系管理的重要作用

现在,客户关系管理在大中型企业的应用日益广泛,虽然实现的程度不同,但大多数企业都认识到了客户关系管理的重要性。

客户关系管理的重要作用主要表现在以下几个方面:

1、 CRM可以加速企业对客户的响应速度:CRM改变了企业的运作流程,企业应用与客户多种方式直接进行交流,大大缩短了企业对客户的响应时间,企业也可以更敏锐的捕捉到客户的需求,从而为改进企业的业务提供了可靠的依据。

2、CRM可以帮助企业改善服务:CRM向客户提供主动的客户关怀,根据销售和服务历史提供个性化的服务,在知识库的支持下向客户提供更专业化的服务,严密的客户纠纷跟踪,这些都成为企业改善服务的有力保证。

3、CRM可以提高企业的工作效率:由于CRM建立了客户与企业打交道的统一平台,客户与企业一接触就可以完成多项业务,因此办事效率大大提高。

4、CRM可以有效的降低成本:CRM的运用使得团队销售的效率和准确率大大提高,服务质量的提高也使得服务时间和工作量大大降低,这些都无形中降低了企业的运作成本。

5、CRM可以规范企业的管理:CRM提供了统一的业务平台,并且通过自动化的工作流程将企业的各种业务紧密结合起来,这样就将个人的工作纳入到企业规范的业务流程中去,与此同时将发生的各种业务信息存储在统一的数据库中,从而避免了重复工作,以及人员流动造成的损失。

6、CRM可以帮助企业深入挖掘客户的需求:CRM注意收集各种客户信息,并将这些信息存储在统一的数据库中,同时CRM还提供了数据挖掘工具,可以帮助企业对客户的各种信息进行深入的分析和挖掘,使得企业“比客户自己更了解客户”。

- 5 -

第二章 客户关系管理概述

7、CRM可以为企业的决策提供科学的支持:CRM是建立在“海量”的数据和逻辑关系的基础上。掌握了这些,企业的管理者就可以做出科学、准确的决策,使得企业在竞争中占尽先机。

2.3 CRM的实现过程

CRM的实现过程大体上分为以下三个步骤[2,3]: 1、调查、收集客户信息资料

数据对CRM显得十分重要,如何获得客户的相关数据呢?方法和渠道是什么呢?很显然,有网络方式,也有传统的调查表、电讯工具等,还有企业日常经营所建立的数据库。这一阶段是CRM的基础。目的是将所有客户的信息集中起来,将每个客户的完整原始资料登记进入客户信息资料库,包括客户代码、客户名称等所有的客户基本信息。 2、客户信息分析

分析是CRM成功的关键。只有通过对CRM的分析才有可能有效地对客户关系进行管理。对客户信息的分析,可以使销售人员和分销商更好地掌握客户的需求,与客户进行卓有成效地接触。因为任何事物都有一定的规律性,客户关系管理也不例外。只有通过对客户群体组成的分析,得到群体客户在年龄、职业等方面的特征,才能更好的应对当今流行的个性化服务(“一对一”的营销)。 3、实现企业战略决策

最后这一阶段使企业可以利用所得到的有价值的深入分析来获得,通过包括市场营销、销售和客户服务在内的所有面向客户的活动,以及管理层如何进行经营决策方面的行为,使得企业的业务流程和组织结构得以修正和整合。 如果不进行CRM分析,企业就如同瞎子摸象,对客户充满神秘感,不知道如何吸引客户,引导客户。深入分析客户行为,将使企业对客户的理解不依赖于那些单薄的证据。可靠的数据化的结论会引导企业业务流程的优化,这将会使客户满意,也必将延长企业与客户的关系实现双赢。

- 6 -

第二章 客户关系管理概述

2.4 CRM的发展趋势及前景

随着市场环境日益成熟,竞争日趋激烈,客户资源日显重要。现代企业管理的重心随之从传统的生产、物流、财务等内部管理转向全面的客户关系管理,CRM系统因而成为企业的重点。应用需求和信息技术的发展是推动CRM系统发展方向的重要因素,目前CRM的发展呈现以下趋势:CRM系统将全面采用B/S技术和全面集成各种信息交流技术,除此之外,更重要的是:CRM系统将更多的采用数据仓库和数据挖掘技术。

作为管理客户资源这一企业核心资源的信息系统,CRM系统必须具备强大的数据分析和挖掘功能,为管理者作出正确的决策提供及时而准确的依据。数据仓库(Data Warehouse )、数据挖掘(Data Mining)和OLAP技术己成为CRM系统提供决策支持的关键技术。CRM系统可以利用这些技术为企业建立完善的、量化的客户价值评估体系,以销售额、利润等原始数据为指标建立评估模型,找出对企业最有价值的客户群体并分析其特征,帮助企业制定更合理的经营策略。通过应用数据仓库和挖掘技术,一个CRM系统还能够透视企业销售、市场和服务等各个业务环节,按照组织机构、时间、产品线和客户群体特征等各种维度进行多维数据分析和数据挖掘,从而帮助企业及时发现市场环境的细微变化和自身业务流程中的潜在问题,迅速采取相应的应对措施。

2.5本章小结

本章主要介绍了客户关系管理的基本概念,阐述了在企业中进行客户关系管理的重要作用,以及从收集资料、信息分析到实现企业战略决策的整个实现客户关系管理得过程。最后从客户关系管理系统、数据仓库和挖掘技术简单介绍了客户关系管理的发展趋势及前景。由此章可以知道,客户关系管理对于企业的生存发展至关重要,而且随着科学技术的发展,客户关系管理将会融入更多的先进技术,而且其功能和作用也会日益完善。

- 7 -

第三章 数据挖掘的基本理论

第三章 数据挖掘的基本理论

3.1数据挖掘的概念

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又潜在、有用的信息和知识的过程。还有很多和这一术语相近似的术语,如从数据库中发现知识、数据分析、数据融合以及决策支持等。如人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构数据。发现知识的方法可以是数学的,也可以是非数学的,可以使演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它汇集了不同领域的知识,尤其是数据库、人工智能、数理统计、可视化、等方面。

数据挖掘的概念具体如图3.1,源数据继承得到数据,数据经过选择得到目标数据,目标数据经过处理后得到预处理后数据。后数据经过挖掘得到各种模

式的数据,各种模式的数据经过解释就是知识[4,5]。

? 结果解释 ?

数据挖掘 知识 模式数据 预处理 后数据 数据选择 数据集成 目标数据 数据

源数据 准备 挖掘 表达解释 图3.1 数据挖掘技术的概念 - 8 -

第三章 数据挖掘的基本理论

3.2 数据挖掘的任务

数据挖掘任务一般可分为两类:描述和预测。描述性挖掘任务刻画数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断,以进行预测。具体任务分为: 1、总结规则挖掘

从客户指定的数据中从不同的角度或不同的层次上挖掘出平均值/极小值/极大值、总和、百分比等。挖掘结果运用特征规则和统计的曲线图表等表示。 2、关联规则挖掘

从客户指令的数据库中挖掘出满足一定条件的依赖性关系。 3、分类规则挖掘

找出描述并区分数据类或概念的模型,以便使用此模型预测类标记未知的对象类。它通常使用类标记己知的数据对象作为训练数据集,通过对该数据集的分析,导出数据的分类模型,然后使用模型预测未知数据。 4、聚类

聚类与分类不同,它没有类标记作为指导,类标记由它本身产生。对象根据最大化类内的相似性、最小化类间的相似性的原则进行聚类和分组。[9] 5、预测分析

用于描述行为随时间变化的对象的规律或趋势,并对其建模。

所有用来进行分类及估计的技术都可以经过修正之后,通过已知变量数值的训练组数据来得到。其中历史性数据是一个很好的来源。历史性数据可以用来建立模型,以检查近年来观察值的变化,若运用最新数据作为输入值,可以获得未来变化的预测值。

3.3数据挖掘的技术

最常用的数据挖掘技术有:[12,14,15]

- 9 -

第三章 数据挖掘的基本理论

1、人工神经网络(Artificial Neural Network):它从结构上模仿生物神经网络,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征挖掘等多种数据挖掘任务。

2、决策树(Decision Tree):用树形结构来表示决策集合,这些决策集合通过数据集的分类产生规则。典型的决策方法有分类回归树(CART ),一般用于分类规则的挖掘。

3、遗传算法(Genetic Algorithm):基于生物进化的概念设计一系列的过程来达到优化的目的。这些过程有基因组合、交叉、变异和自然选择。为了应用遗传算法,需要把数据挖掘任务表达为一种搜索问题而发挥遗传算法的优化搜索能力。

4、最近邻技术(Nearest Neighbor):通过k个最与之相近的历史记录的组合来辨别新的记录,有时也称这种技术为k-最近邻方法。这种技术可以用作聚类、偏差分析等挖掘任务。

5、规则归纳(Rule Induction):通过统计方法归纳、提取有价值的if—then规则。规则归纳技术在数据挖掘中广泛使用,例如关联规则的挖掘。

6、可视化(Visualization):采用直观的图形方式将信息模式、数据关联或趋势呈现给决策者,决策者可以通过可视化技术直观地分析数据关系。

3.4数据挖掘的功能及作用

数据挖掘是整个客户关系管理中最重要的组成部分,是客户关系管理创造商业价值的关键。

许多企业有数以百万计的历史数据,要经过传统的统计分析方法分析相当困难,容易错失企业应有的商机。数据挖掘则利用高级统计工具和人工智能技术,对数据库或其它电子文档提供的庞杂数据进行筛选、推导与模型构造等操作,充分了解客户购物信息,有效地和客户建立亲密关系,找出恰当的营销模式,正确掌握未来经营动态,有效地提供营销、销售和服务的决策支持,让企

- 10 -

第三章 数据挖掘的基本理论

业得到充分的信息而展开行动。并于最恰当的时间、最恰当的地点,给最恰当的客户提供最恰当的一对一的产品和服务。

有了数据挖掘,可以更深层次地了解客户,与客户深交,更有效地进行营销,从而为企业扩大原有商机。

有了数据挖掘,可揭露隐含在数据与模式中的闪光点,从原始数据获取崭新知识,从而为企业创造新的商机。

有了数据挖掘,可以更准确地预知未来客户、潜在客户,预知未来的需求和未来的经济状况,大幅提高目标市场营销的准确度,减少无目标的营销策略,从而较其他竞争者优先获得商机。

总之,正是有了数据挖掘,使企业从大量数据中获得了深层的、隐含的、潜在的、未来的客户知识,为企业扩大原有商机、创造新的商机、优先获得商机提供非常有利的条件,进而为企业经营提供更有效的营销、销售和服务的决策支持,使数据挖掘成为客户关系管理中最重要的也是最关键的一个组成部分。

3.5本章小结

本章从数据挖掘的对象以及数据挖掘的简单过程全面揭示了数据挖掘的含义 ,然后说明了数据挖掘的任务,即数据挖掘可以产生什么效果。并简单介绍了常用的数据挖掘技术——神经网络、决策树、遗传算法、关联规则等。以及数据挖掘的功能及作用,说明了在客户关系管理中应用数据挖掘技术将是一个大的趋势,并有广阔的发展前景。从而引出下一章:数据挖掘技术在客户关系管理中的应用。

- 11 -

第四章 数据挖掘技术在客户关系管理中的应用

第四章 数据挖掘技术在客户关系管理中的应用

由于数据挖掘技术的日益成熟和计算机科学技术的发展,数据挖掘技术已越来越多的应用到计算机领域,数据库中数据挖掘技术的应用就是一个很典型的例子;而除此之外,数据挖掘技术的应用前景还非常广泛,例如客户关系管理领域,下面介绍一下数据挖掘在客户关系管理中的应用:

4.1数据挖掘与客户关系管理

您听说啤酒与尿布的故事吗?听到这两个词的时候,您也许会觉得它们毫无联系,但是它们之间的联系却成为业内广为流传的佳话。故事是这样的:

美国的大型零售商沃尔玛内部的数据仓库系统里集中了详细的原始交易数据,在这些原始交易数据的基础上,沃尔玛利用数据挖掘(Data Mining)工具对这些数据进行分析和挖掘。一个意外的发现就是:尿布和啤酒的销售量相互关联!啤酒和尿布表面看起来风马牛不相及,借助于数据仓库系统,商家发现了隐藏在背后的事实:购买尿布的家庭,家中必然有小孩,孩子的母亲通常会在家中照顾小孩,而父亲在购买尿布的同时,常常顺便帮自己买一些啤酒。既然尿布与啤酒一起购买的机会最多,沃尔玛就在它的商店里将它们并排摆放在一起,并在二者之间放上土豆片之类的佐酒小食品,结果是尿布与啤酒的销售量马上成倍增长,给企业带来丰厚的利润。

客户被企业所重视已经由来己久,寻找新客户对于企业的重要性不言而喻,但是维持己有的客户关系也很重要。而且进攻型的营销成本远远高于防守型的营销成本,吸引新顾客的成本至少是保持老顾客的成本的10倍。越来越多的企业认识到维系现有的顾客的重要性,现有的顾客代表着最佳的利润增长机会。营销学中有一条著名的“80-20定律”,也即80%的业绩来自20%的经常惠顾的顾客。因此,对企业有不同贡献的顾客的到的却是同样的对待,不仅不助于提高顾客的积极性,而且对企业在激烈的竞争中发展也是不利的。而哪些顾客对企业贡献大,哪些贡献少甚至没有贡献?怎样制定策略才能增加营业额?这些潜在的信息怎样去发现呢?数据挖掘能帮你找到答案。对于企业,进行客户关

- 12 -

第四章 数据挖掘技术在客户关系管理中的应用

系管理需要一种技术来帮助它发现潜在的信息,而这正好是数据挖掘技术的优势。

4.2数据挖掘在客户关系管理中的功能

如果企业把利润作为自己的目标,客户关系管理则是达到这个目标的最有用的工具,而数据挖掘是这个工具的最佳引擎。数据挖掘是指从大量数据中寻找隐藏的信息过程。具体到CRM中,企业可以通过数据挖掘,分别针对企业经营策略、目标定位、操作效能与测量评估等几个方面的相关问题,从市场与顾客所搜集积累的大量数据中高效率地挖掘出消费者最关心和最重要的答案,并以此建立真正由客户需求出发的客户关系管理。同时,完整的数据挖掘还可从数据仓库提供的大量顾客数据中挖掘到充分的信息来指导工作人员的行动,使他们能在适当的时间和地点提供顾客适宜的产品及服务,大幅提高作业的效率。

数据挖掘可以应用到CRM的不同方面和阶段,主要包括: 1、一对一营销

企业内部员工必须认识到客户是企业永恒的宝藏,而不是本部门的一次交易。每一次与客户接触都是了解客户的过程,也是客户体验企业的机会。因此,真正的关心客户,为每位客户设计合适的和个性化的建议,才能让客户体会到企业的价值。近年来,一对一营销正在被众多的企业所采用。一对一营销能够了解每一个客户并同其建立起持久的关系。通过特征化和分类,数据挖掘可以把大量的客户分成不同的类,在每一个类里的客户具有相似的属性,而不同类里的客户的属性也不同。通过数据挖掘了解不同客户的偏好,提供有针对性的产品和服务,可以大大提高各类客户对企业和产品的满意度。 2、客户盈利能力分析

在客户群中,客户的盈利能力有很大的区别。如果不知道客户的盈利能力,就很难制定有效的营销策略以获取最有价值的客户,或者提高有价值客户的忠诚度。数据挖掘技术可以用来预测在不同的市场活动情况下客户盈利能力的变化。它从客户的交易历史纪录中发现一些行为模式,并使用这些行为模式来预测客户盈利能力的高低或者发现盈利能力较高的新客户。

- 13 -

第四章 数据挖掘技术在客户关系管理中的应用

3、交叉销售

企业与客户之间的商业关系是一种持续的不断发展的关系。在客户与企业建立起这种双向关系之后,可以使用很多方法使这种客户关系趋于完善,包括:延长这种关系的时间,在维持这样的关系期间增加互相的接触,在每一次互相接触中获得更多的利润。所有这些都可以通过交叉销售来实现。交叉销售是向现有客户提供新的产品和服务的营销过程。交叉销售是建立在双赢原则基础上的,对客户来讲,要得到更多更好满足需求的服务且从中受益;对企业来讲,也会因销售额的增长而获益。通过相关分析,数据挖掘可以帮助你分析出最优的合理的销售匹配。相关分析的结果可以用在交叉销售的两个方面:一方面是对于购买频率较高的商品组合,找出那些购买了组合中大部分商品的顾客,向他们推销“遗漏的”商品;另一方面是对每个顾客找出比较适用的相关规律,向他们推销对应的商品系列。通过聚类分析,可以确定属于某一类的顾客经常购买的商品,并向没有购买的此类顾客推销这些商品。 4、客户的获取

在大多数商业领域中,业务发展的主要指标体系中都包括新客户的获取能力。新客户的获取包括发现那些对企业产品不了解的顾客,也可能是以前接受竞争对手服务的顾客。通过对这些用户的细分,可以帮助企业完成潜在客户的筛选工作 5、客户的保持

随着各个行业的竞争越来越激烈,企业获得新客户的成本不断地上升,因此保持原有客户就显得越来越重要。一个企业的客户一般可分为三类:无价值或低价值的客户、不会轻易走掉的有价值的客户和不断地寻找更优惠的价值与更好服务的有价值的客户。传统的市场活动是针对前两类客户的,而现代客户关系管理认为,特别需要用市场手段来维护的客户是第三类客户,这样做会降低企业运营成本。数据挖掘可发现易流失的客户,企业就可以针对客户的需求采取相应措施。

- 14 -

第四章 数据挖掘技术在客户关系管理中的应用

4.3企业进行数据挖掘项目的方式

企业进行数据挖掘项目有以下5种方式,具体进行数据挖掘项目时,可以选择一种或联合几种一起进行。 1、购买记分模型

记分模型将成千上万的复杂的指标简化成一个分数,该分数是对具体应用定级的标准。简单的例子如IQ记分。购买记分模型的优点是速度快且简单。 2、购买数据挖掘软件

数据挖掘的软件分为两种形式,一种是在软件内部,具体实现了一个模型,该模型可能是决策规则的集合,也可能是一个已经训练好的神经网络,这种软件能直接应用于某一行业的特地问题;另一种软件,实现了数据挖掘的整个建模过程,该建模过程通过模版或向导的形式针对特定行业创建模型。 3、购买固定模型软件

这种模型软件实施成功的前提是模型所模拟的环境必须和公司的产品、客户以及市场条件相类似。但是当条件改变的时候,这种模型不能根据环境的变化做出相应的修改和调整。 4、购买创建模型的开发工具

一旦有合适的输入、输出变量,就能用这种软件自动化创建建模的过程,并且可以从创建的多个模型中,选择出最好的一个。这回工具解决了一个问题,即条件的变化不影响模型的创建,同时又出现了另一个问题:数据挖掘中许多重要的过程不能自动完成,比如理解商业问题、数据预处理、创建派生变量等。例如IBM的Intelligent Miner属于这一类软件。 5、数据挖掘咨询

向外部的数据挖掘专家进行咨询,对公司进行数据挖掘项目是很有帮助的。特别是公司内部没有对数据挖掘熟悉的人才时,这种方式显得尤为重要。那么从哪儿寻找数据挖掘专家呢?一种途径是通过数据挖掘软件商,一般来说,他们都提供关于自己软件和数据挖掘知识的培训课程,对于初次进行数据挖掘项

- 15 -

第四章 数据挖掘技术在客户关系管理中的应用

目的公司来说,这是一种很好的方法,比如IBM公司的商业智能培训。另一种途径是通过数据挖掘中心,数据挖掘中心一般是学校和研究机构,在商业的资助下创办的。

4.4在客户关系管理中应用数据挖掘的过程

要想将数据挖掘作为一种竞争的武器,就必须将其纳入一个更大的过程当中,从而保证从数据挖掘中获得的信息转变为可以行动的结果。下面给出如何车成功地使用数据挖掘工具和技术来在最大限度上提高其竞争优势的整个步骤。该步骤主要包括:问题定义,发现问题,制定计划,采取行动及检测结果等。 1、问题定义

问题定义主要是对要解决的某一问题进行描述。例如,随着竞争的加剧,仅仅使用传统的营销方法已经很难吸引顾客。下面,给出采用数据挖掘方法描述客户分类问题的实例。

客户分类问题定义:如何从公司的基本客户识别出有价值的、优质的客户群体,预测怎样才能保留这些客户以及怎样才能对这些客户进行交叉销售。 客户保留问题定义:相对于发展一个新客户,保留一个老客户只需要较少的费用,特别是保留那些有价值的客户更是如此。数字设备公司1995年发表的一份报告估计:为开拓市场而花费在市场营销、广告及赠送样品等的复合费用平均每个新客户为275~400美元。按照移动电话行业通常每年流失30%的客户计算,一年的维护费中每10万名客户不仅可以为企业带来源源不断的收入,而且使企业在发展新客户上的投入上获得丰富的回报。数据挖掘模式为企业了解高价值的特征并进一步预测其愿望提供了有效途径。这种模式可以帮助企业及早发现客户可能离开的征兆,从而用更有吸引力的产品保留住这些客户。

交叉销售的问题定义:企业向客户销售的产品越多,客户的价值也就越高。客户的增长意味着通过向他们销售更多的产品或服务而提高了客户的价值。为增加客户而采取的促销活动应当能够为每一位客户提供他们个人最感兴趣的产

- 16 -

第四章 数据挖掘技术在客户关系管理中的应用

品或产品组合。数据挖掘软件将可以帮助企业准确的发现特别适合于某一特定产品的客户。 2、发现信息

通过数据挖掘技术分析,可从其客户那里发现更多的信息。首先,需要从公司的客户群中识别并划分出高价值的客户,也就是要快速识别出那些真正需要保留的客户,即以生命周期价值计算那些客户才是最重要、最有价值的客户。经过分析识别出了一类新的客户,并称之为“高价值客户”(Power User)或“A”类客户。 3、制定计划

由于公司的目标是保留并增加客户的价值,所以在识别出这些高价值用户后,接下来就要开展一系列的市场营销活动为这些客户提供有吸引力的产品。 由于向用户提供的新产品可能是多种多样的,所以可以用数据挖掘来确定这些产品中那些最适合于哪类高价值用户。

高价值拥护不同于普通用户。他们有其特殊的去求和问题,因此要保留住这些用户就必须有针对的制定出新的市场计划。也就是制定一个客户忠诚度(Customer loyalty)计划,以便能够保留尽可能多的高价值用户。制定一个有针对性的市场促销计划是一项很难的任务。计划的内容必须基于及时有效的信息,这样才能保证计划的目标能够准确跟得上人们的消费行为及市场的变化。

此外,特定产品在特定时间对某一单个用户才是最为适用的。而且,在特定时期,其他竞争者也会针对本公司的特定产品采取有目标的促销行为。此外,在不同的月份中,一个客户的价值、重程度及市场定位也将随着其家庭或职务的变化而发生变化。 4、采取行动

这一步就是将这些促销计划付诸行动,例如,如何将数据挖掘综合到企业的经营决策和市场促销活动中,如何将数据挖掘模型连同决策交付机制一起集成到客户呼叫中心之中,如何创建一个反馈闭环以检测促销活动的成效。从表面上看其来就是将预测模型的结果付诸实践,这似乎和简单,但事实上却是一

- 17 -

第四章 数据挖掘技术在客户关系管理中的应用

件十分复杂的事情。所采取的原则是当客户与公司进行联系时,开展促销活动最有针对性。客户与公司进行联系的渠道包括呼叫中心或交互式Web站点。用户主动与公司进行交互将使企业有机会获得他们的关注。这也意味着公司需要将数据挖掘模型与客户交互渠道相互集成。为了实现与客户交互渠道的集成,可通过呼叫中心向客户发布新的促销信息,这样当高价值用户将电话打入呼叫中心时,就有可能通过主动的电话交谈而保留住这些高价值的客户。

同时根据数据挖掘模型开发的促销目标分析程序将自动在后台运行。目标分析完成后,呼叫中心应用程序中将显示出一个或多个适合于该客户的产品信息。促销目标分析程序通过数据挖掘模型和业务规则确定出该客户为一个有价值的客户并有可能流失,给操作员提出建议,包括向该客户推荐的新产品以及特殊的折扣优惠。其中向客户推荐的产品都是根据他与公司接触时的特殊需要转而购买其他公司的产品。操作员将按照程序所显示的脚本向客户提出的每一项促销建议都是根据该客户的特征及操作的技能经过个性化而定制的。 5、检测结果

最后一步就是检查市场促销活动的成效。由于市场促销具有较强的时间需求,所以必须尽可能早知道促销活动是否成功。

客户同意购买一项产品,而拒绝了另一项产品。这种一项产品被接受而另一项产品被拒绝的信都将记录在案并将用于改进促销活动。其他诸如客户为什么会拒绝一项产品的原因也将被记录下来。

上述这些信息可以帮助人们更好的确定那些产品将会被接受。市场人员常常想知道的是今天已经向客户提出了那些促销建议并且其中那些建议已被客户接受。根据这些指标可以准确的衡量出以往没有预测手段的情况下采用了数据挖掘模型是否提高了客户对促销建议的响应。这一过程通常需要经过若干次的改进才能提高客户的响应率。

此外,还可在数据挖掘过程中引入“动态学习”机制,使数据挖掘模型能够根据客户对促销建议接受与否动态调查。采用这种方法,不仅使企业可以检测促销活动的成效,而且可以随着促销过程的进行不断改进。

- 18 -

第四章 数据挖掘技术在客户关系管理中的应用

4.5本章小结

本章从一对一营销、客户盈利能力、分析交叉销售、客户的获取、客户的保持等方面介绍了数据挖掘在客户关系管理中的主要作用,并简单说明了企业进行数据挖掘项目五种主要方式——购买记分模型、购买数据挖掘软件、购买固定模型软件、购买创建模型的开发工具、数据挖掘咨询。然后主要研究了在客户关系管理中应用数据挖掘技术的过程——问题定义、发现信息、制定计划、采取行动、检测结果。

- 19 -

第五章 案例分析

第五章 案例分析

由于数据挖掘技术特有的功能作用,许多数据挖掘技术已经成功应用到各个领域,下面的案例说明了汽车销售行业决策树在客户分类方面的应用:

5.1案例背景

关注中国汽车产业的人士都知道,近5年来我国汽车制造业以平均24.5%的速度高速增长,预计今年我国的汽车保有量将突破2900多万辆,汽车销售市场也必将成为一个庞大的“黄金”市场。而在众多的汽车销售店里,怎样才能在激烈的竞争中达到并保持一个好的业绩呢?仅仅靠销售顾问的销售技巧是不够的,企业还需要深入的了解客户,针对不同的客户群制定不同的销售策略。因在一家汽车销售服务有限公司实习并参加培训,因此以数据挖掘技术在汽车销售行业客户关系管理中的研究和应用为案例,分析决策树在客户分类方面的应用。

5.2决策树方法用于客户分类

在日常营业过程,每次来咨询的客户无论是达成交易的和没有达成交易的,都会在公司的CRM数据库中有所记录,用系统数据库或数据仓库中的数据对客户群进行分类,发现达成交易的和未达成交易的客户的特征,从而为企业的汽车销售制定出比较合理的营销策略。在此过程中主要应用了数据挖掘的分类功能,采用的是决策树分类方法,基本的步骤如下所示:

5.2.1数据准备及转化

1、完成数据收集、数据清理、数据相关性分析以及数据变换等工作。

数据收集可以通过在数据库执行一系列的查询语句获得;数据清理就是减少和消除数据集中的噪声数据和处理一系列的缺省值(用平均值代替);相关性分析就是剔除数据集中与目标任务不相关或弱相关的属性字段,尽量的简化数据集;数据变换则主要完成的是数据离散化、区间变化和数据概化等任务。

- 20 -

第五章 案例分析

2、从准备好的数据集中抽取出训练数据集,分析训练数据集中的数据库元组,然后构造模型。

这里假定每一条记录都属于一个确定的类别(类别是事先确定好的),由一个称作类标号的属性值确定。在本例中号代表的是是否达成交易的这个属性,Y代表达成,N代表没有达成交易,然后利用面向属性的归纳方法对每个属性进行概化处理,过程如下所示:首先准备原始训练数据如表5.1

表5.1原始训练数据集 交易号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ?? 客户姓名 电话 张新 王立海 王光雨 市政局 信用等级 购买性质 个人购买 个人购买 个人购买 企业购买 企业购买 个人购买 个人购买 个人购买 个人购买 企业购买 单位购买 个人购买 单位购买 企业购买 交易额 来访次数 达成交易 Y Y N Y N Y N N Y Y Y N Y Y 15963301986 好 13896546656 一般 2587987 2588886 好 差 好 24,8960 3 32,98564 5 12,98675 4 15,9860 3 19,9860 4 28,6890 4 65,9850 2 111,6985 5 80,98650 1 16,9880 3 10,9860 2 30,98560 2 100,9800 2 35,4890 4 今晨集团 2569868 刘建明 杨慧兰 桑林 张玉林 13895464265 好 13968459544 差 13645987852 差 13895461233 一般 好 一般 差 一般 差 胜利油田 2259888 垦利县委 6598245 赵强 市政局 1369875645 2698989 盛华工贸 2654895 ?? ?? - 21 -

第五章 案例分析

交易号:该属性有许多且无概化操作,属性删除。 客户姓名:该属性有许多且无概化操作,属性删除。 电话:该属性有许多且无概化操作,属性删除。 信用等级:该属性值由三个,属性值保留。

购买性质:该属性可离散化大区间{个人购买,非个人购买}。

来访次数:该属性是连续的,离散化到区间{少,多},其中<=3次为少,>3次为多。

交易额: 该属性是连续的,离散到区间{多,一般,少},其中>=50万为多,<=20万为少,其余为一般。

达成交易:该属性值有两个,属性保留。 概化后的结果如表5.2所示:

表5.2概化后的训练数据集

信用等级 好 一般 好 差 好 好 差 差 一般 好 购买性质 非个人购买 非个人购买 非个人购买 个人购买 个人购买 非个人购买 非个人购买 非个人购买 非个人购买 个人购买 交易额 中 中 中 小 小 中 大 大 大 小 来访次数 少 多 多 少 多 少 多 少 少 少 达成交易 Y Y N Y N Y N N Y Y - 22 -

第五章 案例分析

一般 差 一般 差 个人购买 非个人购买 个人购买 个人购买 小 中 大 中 多 少 少 多 Y N Y Y 5.2.2构造模型

接下来使用决策树方法构造分类模型。决策树是一个树形结构,内部节点上选用一个属性进行分割,每个分叉都是分割的一个部分;每个叶子节点表示一个分布。对于决策树,最基本的生成算法是贪心算发,它采用自上而下分而治之的方法。开始时,所有的数据都在根节点,属性都是种类字段(如果是连续的,将其离散化),然后所有记录用所选属性递归进行分割,属性的选择是基于一个启发式规则或者一个统计的度量。当一个结点上的数据都是同一个类别或者没有属性可以再用于对数据进行分割时,则停止分割并生成一个叶节点。因此,决策树的关键是在每个节点上分类属性的选择。在此例中选择比较经典的ID3算法,即利用基于熵的最高信息增益法选择属性,在此,首先对信息增益法的作简单介绍:

设S是s个数据样本的集合。假定类标号属性具有m个不同值,定义m个不同类Ci(i=1??m)。设S1是类C1种的样本数。对一个给定的样本分类所需的期望信息由下式给出:

I(S1,S2,??Sm)= -∑Pilog2(Pi)

其中i=1??m,Pi是任意样本属于Si的概率,一般用Ci/C估计代替Pi 设属性有V个不同值{a1,a2,??av},可以根据属性值将C划分成V个子集 {C1,C2,??Cv};Cij是子集Cj中Si的样本数。由A划分成子集的熵(用此信息分类后需要的期望信息)为:

E(A)=∑(C1j+C2j+?Cmj)I(C1j,C2j,?Cmj)/S

则以A分支获得的收益信息为:

- 23 -

第五章 案例分析

Gain(A)=I(C1,C2,?Cm)—E(A)

熵是一个衡量系统混乱程度的统计量,熵越大表示系统越混乱。分类的目的是提取系统信息使系统向这更加有序、有规则组织的方向发展,所以最佳的分支方案是使熵减少量最大的方案。而Gain(A)就是由于知道属性A的值,从而导致熵的期望值减少。因此,决策树的分支方案就是计算每个属性的信息增益,取具有最高信息增益(最小期望信息)的属性进行分支。

在上表中,类标号属性(达成交易)有两个不同的值,因此有两个不同的类(m=2),类S1对应于达成交易(用Y表示),有9个样本;S2对应于未达成交易(用N表示),有5个样本。则样本分类所需的期望信息:

I(9,5)= -(9/14)log2(9/14)-(5/14)log2(5/14)=0.94 下面计算每个属性的熵,从信用等级开始:

对于信用等级差的:C11= 2 ,C21=3 (IC11 ,C21)= ―2/5log2(2/5)―3/5log2(3/5)=0.97 对于信用等级一般的:C12=4,C22=0 I(C12, C22)=―4/4log2(4/4)=0

对于信用等级好的:C13=3 ,C23=2 (IC13 ,C23)= ―3/5log2(3/5)―2/5log2(2/5)=0397 计算E和Gain:

E(信用等级)=5/14 I(C11 ,C21)+4/14 I(C12, C22)+5/14I(C13 ,C23)=0.694 Gain(信用等级)=I(C1,C2)—E(信用等级)=0.9712-0.7244=0.246 用同样的方法计算可得: Gain(购买性质)=0.152

Gain(交易额)=0.031 Gain(来访次数)=0.049

由于Gain(来访次数)最大,所以选来访次数作测试属性创建一个结点,并对每个属性值引出一个分支,样本数据按此划分。而另外来两个分支上的样本则重复上面的步骤继续建立节点并分支,并最终生成叶节点。整个过程如图5.3所示:

- 24 -

第五章 案例分析

信用等级 好 一般 差

购买性质 个人 非个人 交易额 中 中 小 中 小 来访次数 少 多 多 少 少 达成交易 Y N N Y Y 购买性质 非个人 非个人 交易额 中 大 小 大 来访次数 多 少 多 少 达成交易 Y Y Y Y 购买性质 个人 非个人 非个人 非个人 交易额 小 大 大 中 中 来访次数 少 多 少 少 多 达成交易 Y N N N N 个人 非个人 个人 个人 个人 个人 信用等级 好 一般 差 购买交易性质 额 个人 非个人 来访次数 少 多 多 少 少 达成交易 Y N N Y Y 达成交易 Gain(性质)=0.97 Gain(性质)=0.27 Gain(交易额)=0.67 Gain(交易额)=0.27 购买性质 个人 非个人 非个人 非个人 交易额 小 大 大 中 中 来访次数 少 多 少 少 多 达成交易 Y N N N N 中 中 小 中 小 个人 非个人 个人 Gain(次数)=0.58 Gain(次数)=0.95 个人

- 25 -

第五章 案例分析 信用等级 好 一般 差 成交达易 图5.3结构树方法构造分类模型

生成决策树以后,下一步就是剪枝。在决策树创建时,由于数据中的噪声和孤立点,许多分支反映的是训练数据中的异常,剪枝就是处理这种过分适应数据问题,简直通常是使用统计度量来剪掉其中最不可靠的分支,这将带来较快的分类并提高树独立于测试数据,从而提高正确分类的能力。剪枝有两种策略:先剪枝和剪枝,先剪枝通过提前停止树的构造而对树剪枝;而后剪枝则对完全生长的树剪枝。此例中由于训练数据集比较简单,所以不必剪枝,但实际上大多数决策树应用时要剪枝的。

接下来有生成的决策树给出分类规则,决策树可以很容易的转换分类规则,即从根节点到叶节点的每条路径均可以转换成一条行为“if——then”的分类规则,其中if 部分是沿着某条路径上的每个内部节点的属性——值对形成一个合取向,then部分是包含类预测的叶节,此例生成的分类规则如下: If(信用等级=“一般”) then (达成交易=Y)

If(信用等级=\好\购买性质=\个人\) then (达成交易=Y) If(信用等级=\好\购买性质=\企业\) then (达成交易=N) If(信用等级=\差\来访次数=\少\) then (达成交易=Y) If(信用等级=\差\来访次数=\多\) then (达成交易=N)

购买性质 达成 交易 来访次数 个人 企业 少 多 未达成交易 达成 交易 未达成交易 - 26 -

第五章 案例分析

5.2.3结果分析

企业利用以上规则可以发现对其营销十分有用的模式,比如信用等级好的个人,购买时一般会达成交易;而对于信用等级好的企业,却不能打成交易,可见企业在这方面流失了很大的市场,应尽快采取措施弥补;而对于信用等级差的客户,来访次数多却不能打成交易,经过分析可以发现,企业可能对信用的差的客户采取了一些限制交易的措施??

给出分类模型后,要用测试集评估模型的预测正确率,测试集中的数据是从样本集中随即取出并独立于训练样本的。模型的准确率可以用被模型正确分类的测试样本的百分比来表示,若模型的准确率是可以接受的,企业就可以依据模型将客户分类,针对不同的客户展开有针对性地营销。

至此,已经初步完成了一个基于决策树分类技术的客户分类简单示例,但实际应用中大多数决策树分类过程要复杂的多,计算量也要大很多,这主要是因为用于分类的样本数据往往很大,属性字段也很多,决策树的生成算法也很多,而且还要涉及到剪枝的操作。在实际的操作过程中,要选择那些字段,选择何种算法还需要进行反复综合的评估。

5.3 本章小结

本章主要以汽车行业决策树技术在客户分类中的应用为案例,介绍了数据挖掘技术在客户关系管理中的作用,其实数据挖掘技术相对以前已经较为成熟,而且在许多领域也得到了广泛和深入的应用,但是由于时间和论文篇幅的限制, 可能研究的还不是很透彻,如果希望了解更多,可以参阅相关方面的书籍或资料,相信您会发现数据挖掘的魅力所在。

- 27 -

结 论

结 论

本论文在介绍了此题目的产生背景及目的意义后,分别介绍了客户关系管理和数据挖掘技术的概念、作用及现状等;然后又重点分析研究了数据挖掘技术在客户关系管理中的应用,最后以数据挖掘技术——决策树在客户分类中的应用为案例,简单介绍了数据挖掘技术应用的方法。由于时间等方面的原因,对于数据挖掘技术的研究还不是全面,本想在论文中把几种常用的数据挖掘技术在客户关系管理方面的应用都用案例进行说明和解释,但是由于篇幅和时间的限制,只能列举一种应用,希望有机会继续进行深入研究。

经过此次论文研究,可以知道现在客户关系管理的发展需要数据挖掘技术的支持,数据挖掘技术也会在应用中体现它的商业价值。现在部分大型企业的客户关系管理中应用数据挖掘技术的比较多,但在中小型企业还有部分大型企业由于没有认识到数据挖掘技术的价值或者因为缺乏能力和资金等某些原因,还没有在客户关系管理中应用数据挖掘技术,只是对客户资料的简单管理,但随着经济的发展和竞争的日趋激烈,在客户关系中应用数据挖掘技术是一个必然的趋势。

- 28 -

参 考 文 献

参考文献

[1] 丁秋林,力士奇. 客户关系管理[M]. 北京:清华大学出版社,2002. [2] 野口吉昭(日). 客户关系管理实施流程[M]. 北京:机械工业出版社,2003. [3] 陈明亮. 客户关系管理理论与软件[M]. 杭州:浙江大学出版社,2004. [4] 朱爱群. 客户关系管理与数据挖掘[M]. 北京:中国财政经济出版社,2001. [5] 李智刚. 决策支持系统原理与应用[M]. 北京:高等教育出版社,2005.

[6] Tom soukup,Ian Davidson(美). 可视化数据挖掘[M]. 北京:电子工业出版社, 2004. [7] Paolo Giudici(意). 实用数据挖掘[M]. 北京:电子工业出版社,2004. [8] Olivia Parr Rud(美). 数据挖掘实践[M]. 北京:机械工业出版社,2003.

[9] Jiawei Han,Micheline Kamber(加). 数据挖掘概念与技术[M]. 北京:机械工业出版社,2001. [10] Margaret H.Dunham. 数据挖掘教程[M]. 北京:清华大学出版社,2005.

[11] 迈克尔-J-A-贝里,戈登-S-利诺夫(美). 数据挖掘[M]. 北京:中国财政经济出版社,2004. [12] 陈文伟,黄金才,赵新昱. 数据挖掘技术[M]. 北京:北京工业大学出版社,2002. [13] R格罗思(美). 数据挖掘—构筑企业竞争优势[M]. 西安:西安交通大学出版社,2001. [14] 林杰斌等. 数据挖掘与OLAP理论与实务[M]. 北京:清华大学出版社,2003.

[15] Mehmed Kantardzic(美). 数据挖掘概念、模型、方法和算法[M]. 北京:清华大学出版社, 2003.

- 29 -

致 谢

- 30 -

本文来源:https://www.bwwdw.com/article/28vp.html

Top