ERP与数据挖掘技术的结合

更新时间:2024-06-06 16:44:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

ERP与数据挖掘技术的结合使用

摘 要:传统的erp系统实现了对数据的查询和统计,但缺乏对各子系统的综合查询、辅助决策的支持。在目前的erp产品中,与数据挖掘技术的结合还较少,erp与数据挖掘的结合必定使erp系统的应用更加有效,对此研究具有实践意义。本文主要围绕在erp中使用数据挖掘技术展开研究,将数据挖掘理论应用于实际的erp项目中,实现erp系统与数据挖掘技术的结合。 关键词:erp;数据挖掘;数据仓库;olap 引言

erp(企业资源计划enterprise resource planning)是以管理思想为基础,建立在信息技术之上的一整套管理信息系统,其目的是整合、优化企业资源。在erp的发展中,增加数据仓库dw和联机分析处理olap功能引人注目。在传统的erp系统中,实现了联机事务处理功能,但局限于对数据的查询和统计,对各子系统的综合查询、辅助决策的支持欠缺。由于erp系统的发展及我国erp系统应用水平的提高,数据量越来越大,企业领导对决策的要求越来越高,希望从纷繁的日常数据中得到对企业发展有益的信息,希望能够提供更高层次的数据分析功能,更好地辅助领导进行管理决策。而从大量的数据中找到一些潜在规律,正是数据挖掘研究处理的内容。随着数据挖掘的出现与发展,数据挖掘的技术已经逐渐成熟,应用领域也越来越广。从选型到erp中的各个系统的应用,都可以

使用数据挖掘技术,以提高系统的辅助决策能力。 一、数据挖掘技术在销售管理中的应用

由于销售管理是任何企业都不可或缺的管理内容,销售管理系统是整个erp系统中的重要组成部分,除了提供报价单、订单、发货单等业务处理功能外,还应根据销售的历史情况进行市场分析、汇总统计出对有利于于企业的经营决策信息。

销售分析中,联机分析处理(olap)技术将起到重要的作用。比如,当企业发现一种产品销售额下降,必须弄清究竟是哪些地区甚至哪个具体城市、哪类销售渠道、哪类产品的影响,在产品性能、质量、价格和服务上同竞争对手有什么差异,有无时间和季节波动的影响。只有掌握具体、细致和实时的信息,才能及时做出正确的决策。销售的统计分析是对销售流程中各项主要业务的处理结果和运作情况进行统计分析,是了解企业销售情况的重要手段。在大量的销售数据中,如何发现潜在的销售机会是非常重要的。如对产品进行销售地区分类,对空间数据库进行挖掘,按洲、国家、省/地区分析不同的产品在不同的区域的欢迎程度。由于产品有区域特性,有的产品在欧洲销售业绩很好,但在亚洲就不一定受欢迎,外销的产品由于营销的前期成本较大,分析产品的区域相关性,可使销售更有针对性、从而降低销售成本。还可查询分析历史数据中不同年份、不同月份产品的销量情况;预测今后的销售量;根据对历史数据中不同销售价格与销售数量的分析,建议合理的销售价格,

从而提高销售额;也可根据不同的价格与销售数量、毛利的分析,从提高毛利的出发点来建议价格。

在销售统计中,多种数据挖掘技术都可使管理者得到有用的信息来辅助决策,以下列出几项数据挖掘技术的具体使用。 (一)决策树的使用。分析客户类别、价格、折扣、日期对销售量有不同的影响程度

先进行数据的预处理,按客户销售表、客户表、地区表得到以下顾客数据库数据元组训练集表格。将原数据中的折扣、价格、销售金额从数值转化为字符类型,如折扣0-5以“5折以下”标识、6-10以“5折以上”标识。类标号属性购买产品程序有两个不同值(即{大量,少量}),因此有两个不同的类(m=2)。设类c1对应于大量,而类c2对应于少量。类大量有11个样本,类少量有4个样本。计算对给定样本分类所需的期望信息和信息增益值。将具有最高信息增益的属性选作测试属性。创建一个节点,用测试属性标记,并对于每个属性值,引出一个分枝。重复这一过程,得到在剩余属性中确定具有最高信息增益的属性,直到各分区的样本都属于同一类,可画出决策树。

(二)回归统计技术。对销售量、销售价格等进行预测 对于连续值的预测可以用回归统计技术建模。回归分析是试图从实际数据中寻找某种规律的方法。回归分析确立和分析某种响应和重要因素之间的函数关系。回归值代表任意一个条件期望值,在数

据建模中,经常是给定条件变量下因变量的条件期望值。预测目标视为因变量,则可使用回归技术进行预测。在销售管理中预测某种产品的销售量。根据前一步的判定树分析出影响销售量的重要因素作为自变量,将销售量作为因变量。

线性回归是最简单的回归形式,以直线建模。双变量回归将一个随机变量y(响应变量)视为另一个随机变量x(预测变量)的线性函数。可根据某段时间内产品销售明细进行价格、数量的预测,也可根据模拟定价对数量作出预测。

应用中发现,有些产品的价格与销售数量的关系呈线性关系,有些则不是,无法用线性函数表示价格与销售数量之间的对应关系,则选用非线性函数表示,如渐近回归模型、二次曲线模型、双曲线模型等。

(三)数据仓库和olap技术。用于销量统计中对时间数据库的挖掘,分析历史数据中不同年份不同月份产品的销量情况 数据仓库提供联机分析处理(olap)工具,用于各种粒度的多维数据分析,有利于有效的数据挖掘。许多其他数据挖掘功能,如分类、预测、关联和聚集,都可以与olap操作集成,以加强多个抽象层上的交互知识挖掘。数据仓库和olap工具基于多维数据模型,该模型将数据看作数据立方体(data cube)形式。数据立方体允许以多维对数据建模和观察,它由维和事实定义。维是关于一个组织想要记录的透视或实体,每个维都有维表与之相关联;事实是数值度

量的。

以简单的一个维表说明数据多维数据模型在销量统计中的应用。为了根据年份与月份的销售额进行统计,得出销售同期比的图表,销售数据仓库中采用星型模式,包括一个中心事实表orders销售表,它包含两个维的关键字(销售时间)和一个度量(销售量);包括一个维表time_by_day时间表。使用时,可任意拖拉汇总的条件,对数据立方体进行切片及下钻操作。

通过这种技术的使用,可方便得到各种统计报表,如产品的销售同期比、客户销售同期比、客户-产品销售比、地区-产品销售比、地区销售统计、客户销售统计、产品销售排行、销售员业绩排行等,在传统的erp中也可实现相应的功能,但编程实现繁琐,且不易扩展,使用数据仓库与olap技术可快速进行多类统计,在同一界面上按不同的出发点得到不同的数据。 二、数据挖掘技术在产品质量管理中的应用

现代企业充满竞争,产品的质量是竞争的重要保证。因此,在产品的生产过程中,提高产品质量十分关键,而要提高产品质量首先要分析产品质量问题出现的原因,通过基于联机分析技术(olap)对产品质量进行分析评价,在此基础上针对质量问题的出现原因进行解决。图3给出了一个由操作工人、时间、操作机器、工序、质量检测标准5个维度构成的数据立方体,以及利用olap的上卷、下钻、切块和切片等技术实现对该数据立方体进行数据挖掘的方

案。通过这个方案可以从多方面对产品生产过程中出现的质量情况进行分析统计,了解因操作工人的差异出现产品质量的情况、不同的操作机器、操作时间对产品质量的影响,以及产品不同带来的质量难点等。

数据挖掘的结果要进行可视化的输出。可视化在数据挖掘的各个阶段都十分重要,用散点图、直方图等统计可视化技术来显示有关数据,对数据的了解更为清楚。 三、结束语

本文主要围绕使用数据挖掘技术在erp系统的应用展开,探讨了在erp的选型、销售管理、质量管理中数据挖掘技术的使用,将数据挖掘理论应用于实际的erp项目中,实现erp系统与数据挖掘技术的结合。在今后的研究工作中,可结合企业的实际情况,研究用数据挖掘能解决更多新问题,如采购供应商的选择、原料质量分析及质量问题的控制、员工的年龄、学历与考评绩效的关系、客户回款情况与客户信用的分析、生产过程中各工序的时序分析等。

参考文献:

[1] 罗文媗. erp系统选型探讨[j]. 中国信息导报,2004,(05),45-46.

[2] 唐林燕. 数据仓库和数据挖掘技术在erp中的应用[j]. 计算机工程,2002,(06):205-207.

[3] 包剑、李义杰、冀常鹏等. 数据挖掘在企业crm中的应用[j]. 华北工学院学报,2004,(02):110-112.

[4] jiawei han micheline kamber. 数据挖掘概念与技术[m].北京:机械工业出版社,2001.

[5] 陈京民等编. 数据仓库与数据挖掘技术[m].北京:电子工业出版社,2002.

[6] 邓超主编. 企业资源规划系统(erp)规范应用指南[m].北京:电子工业出版社,2003.

本文来源:https://www.bwwdw.com/article/p1f6.html

Top