基于Web源的客户需求获取及分析方法
更新时间:2023-08-28 20:03:01 阅读量: 教育文库 文档下载
- 贝贝web源推荐度:
- 相关推荐
市场分析 聚类 市场细分
第10卷第9期2004年9月计算机集成制造系统
COmputerIntegratedManufacturingSyStemS
VOl.10NO.9Sep.2004
文章编号!1006-5911(2004)09-1165-06
基于Web源的客户需求获取及分析方法
郭伟 胡明艳
(天津大学机械工程学院 天津300072)
摘要!为把握市场动态和了解客户需求 提出一种从广域网中及时获取及分析客户信息的方法 在对比分
析分散式和集中式Web信息源优劣特征的基础上 提出了由集中式Web原始信息源到市场分析数据集间的映射关系 建立了以产品生命周期特征为基础的信息分析知识库以及相应的量化处理规则集 该方法基于所建立的知识库和分析规则 采用规则驱动的数据挖掘技术 首先进行原始Web信息单元特征定位分析 进而对信息单元中的客户需求进行词频统计分析和内容分析 以形成产品市场整体趋势以及系统的客户需求分布 最后结合典型行业的信息源进行了具体应用
关键词!源信息;客户需求;数据挖掘中图分类号!TP391.1文献标识码!A
0引言
客户需求是产品开发的驱动力 也是市场营销
不仅信息存储分散 而且内容也具有较大的发散性 对市场或客户的需求难以进行纵深地分析;集中式信息源围绕客户与市场来组织和展开 具有信息量大~涉及面广等诸多优点 为系统地进行用户需求分析提供了可能
表l分布方式
描分
布述于
决策的基础 但传统的市场调查方法由于成本高~周期长 已远不能满足企业对客户信息的需求 随着互联网的飞速发展 特别是集中汇聚客户信息的Web源已经成为了解客户需求~把握市场走向的重要渠道 其相关的理论方法和应用的研究日益成为
1~3]学术界与工业界关注的重点
Web的信息源特征分析
形式
特征
典型示例各网站的新闻频道
新闻~产品介绍~电子商务
信息量大但分散 获取和分析难度大 不全面
Web上的
分散式
多个网站
本文深入分析了Web信息源的特征 针对集中式信息源 建立了面向市场/客户分析的信息组织映射关系 详细介绍了相应的需求获取与分析的流程和方法 并以此为基础 结合汽车行业的典型信息源进行了工具的开发与具体应用的研究 ll.l基于Web的客户需求信息源特征分析
Web信息源特征
基于Web的客户需求信息的分布 总体上可以
集中在某一网站上
集中式
针对某一市场或产品的信息
BBS~产品论坛~厂商网站
信息量大且集中 获取方便 涉及面广
新浪网站的汽车论坛
从市场分析与客户需求角度出发 基于集中式
分为分散式和集中式两种(如表1) 分散式信息源
收稿日期!2003-08-18;修订日期!2003-11-27 基金项目!国家863/CIMS主题资助项目(2003AA415220) 作者简介!郭Web信息源的信息获取方法与基于市场调查方式
相比具有众多优点(如表2) 必将受到企业和客户
伟(1965-) 男 安徽人 天津大学机械工程学院教授 博士 主要从事CIMS的系统建模和集成技术~企业过程管理与优化等方
面的研究 E-mail:WguO@t http://www.77cn.com.cn
市场分析 聚类 市场细分
计算机集成制造系统
第10卷
更大的重视O
表2信息获取途径集中式网络信息源市场调查(传统信息源)
信息获取成本成本低投入大成本高
信息数量数量庞大与投入有关
基于不同获取途径的信息特征对比表
时间
客户客户是
可靠性直接获取客户
内容广泛性涉及内容广泛根据预设的目标进行
产品\竞争\服务方面及时响应反应迟缓
周期短9实时反映客户信息
周期长
反馈慢
主动的信息9可靠性高客户是为提高可靠性被动的
必须加大投入
eb信息源的众多优点9必会使其成为集中式W
获取和分析客户需求的主要信息源O在集中式信息源中9网站论坛是最典型和实用的方式9许多商业网站都提供这种服务9通常每一个论坛都有主题9面向某一类或某一种产品9构成该主题的信息池O客
户通过在网站论坛注册与发表信息帖9形成丰富的用户信息9包含三类内容C①用户信息9如用户的姓名\年龄\职业\联系方式和经济状况等;②用户需求信息O如对产品的看法\意见\使用心得9构成一个信息单元9对某个品牌 产品而言9形成用户信息的聚集(产品信息池)O③产品 市场的累计信息9即某种产品的市场同步表现9产品在整个信息源中的关注状态等O
要求9构成以单元产品特征和技术特征为核心的两
S
市场分析 聚类 市场细分
第9期郭伟等:基于Web源的客户需求获取及分析方法研究
1167
表3典型分析知识库组织结构示例!汽车行业"
面向整个信息源的知识框架
产品级
PLS}关注热点
产品名称型号生产商产量销量
PKD}子集 PKD}
机械部件ABS悬挂离合器
发动机功率.排量转速.扭矩油耗
投入期功能和技术
技术级
成熟期价格变化
衰退期不确定
成长期销售和售后服务
与产品所属的生命周期相联系的知识子集 技术类}转向机构助力方向盘
变速系统挂档自动挡手动挡
价格评论}
销售与售后服务}特约维修站.首保
政策法规}
降价性价比
税燃油税税改费
2.2基于规则的产品池信息单元特征定位分析在集中式Web信息源中 信息单元的特征表示
其中 X11
用户对产品焦点的关注 如产品的价格.服务.性能等0通过单元信息的特征分析 可以确定相关的PKD子集 并由此以相关的PKD子集为重点方向
与依据 使后续进行的信息单元的内容分析更为有效0
信息单元的特征分析 涉及了相关产品的PLS状态 根据分析知识库的构建 定义了下列两条规则以完成PLS状态界定和PKD的子集确定 由此完成单元信息的特征分析0以产品投入期为例 相关规则如下:
第一 依据市场 产品生命周期函数与信息源产品生命周期函数 确定关注产品的PLS值0(1>f(M S>=X1f1(M>+X2f2(S>0
其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和
(2>f1(M>=X11t+X12 +X13T
(3>f2(S>=X21P+X22O+X23 0
X12 X13 X21 X22和X23是各影响因子的权
重 与X1 X2形成一套权重体系 通过层次分析法(AHP>确定具体取值方案 然后选择典型产品的相关数据进行对比分析后确定最终取值0本文中(X1 X2 X11 X12 X13 X21 X22 X23>相应的取值为(0 4 0 6 0 5 0 2 0 3 0 4 0 5 0 1>0式中的t T P O和 分别代表表4中各影响因子的量纲-分值 是通过计算公式 中间值=(影响因子实际值-区间最小值>/(区间最大值-区间最小值> 计算出的中间值加上量纲下限得到的(无区间边界值取实际值的最大/最小值>0PLS的取值区间是依据典型产品的相关数据设计并验证的结果 与选取的分析对象.信息池容量等都有直接的关联 是以大量数据作为基础 以科学的数据挖掘方法---聚类分析[4~6]作为工具来确定的0
第二 依据产品信息单元的PLS状态值 确定关注产品的PKD子集0
EPLB:InVeSting} ThenInVeSting}0If
J
$
E
PKD:
(4>其中 J为信息单元所涉及的产品 $为相应的知识子集中的关键字0PKD子集中各类关键字是按照隶属度的大小有次序的排列的 如式(5>:
PKD:InVeSting}= TechnOlOgy} Price} Sale
(5>andSerVice} POlicy}}0
处于投入期的产品受到更多关注的往往是产品
本身的性能以及采用的新技术 因此技术类关键字作为首先分析的内容排在了PKD子集的最前沿
X2为各自权重0PLS的界定主要从两个方面考虑:①从市场分析维度分析产品所处的生命周期0瞬息万变的市场环境很难量化 只能选取可获得持续信息的细分市场进行分析0②从集中式信息源的数据结构和特点维度出发 挖掘相同周期的产品特性并量化其具体区间 实现产品的自动界定功能 如信息池累计存留时间.顾客发表评论的累计数量等都为产品周期的归属提供了可靠支持0其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和X2为各自权重0鉴于其各自因素的不同影响程度 将式(1>中f1(M>和f2(S>分解如下:
市场分析 聚类 市场细分
计算机集成制造系统
第10卷
其他类的关键字依此类推 其具体计算规则是选择
7
作一定周期的单元信息 按关键字进行词频统计
定和完善具有很重要的意义 先确定子集的初始状态 随着数据量的增加和方法的不断调整 以及分析结果的反馈 使用聚类分析等方法逐步完善各生命周期的PKD 为客户需求分析提供了参考
为其隶属于PKD子集的隶属度
市场整体分析和客户需求分析的效率与准确性对PKD的选择有很大的依赖性 因此PKD集的确
表4典型信息源中产品PLS状态界定判定规则
PLS及其取值区间
影响因子投入期 0 1
成长期 1 2 0.25 1 20 100 0.5 7.5 0.08 0.75 10 100 -10 10
成熟期 2 3 1 10 100 +> 7.5 100 0.75 min T 5
-10 10 min i
衰退期 3 4 10 +> 0 20 0 0.5 min T 5 +> -> -10 max i
分市场特征信息源特征
进入市场时间t a销售量 每周 市场占有率T %信息池累计存留时间P a信息池容量增长率O % %信息池容量增长变化率
0 0.25 0
20 0 0.5 0 0.08 max Oi 10 1
注!T 论坛存在时间 信息池容量增长率 平均每周信息单元数量的增长百分比 信息池容量增长变化率 同一信息池相邻
时间单元的增长率变化
2.3信息单元内容分析及其流程
信息单元的特征定位提供了关键字的有序集
合 PKD子集 为后续的内容分析奠定了基础 本文设计了用于论坛信息获取及信息单元内容分析的系统流程 如图2所示
市场分析 聚类 市场细分
第9期郭伟等:基于Web源的客户需求获取及分析方法研究
1169
表5论坛信息源结构及内容示例
客户信息
需求分析
职业
收入/(元/月)
年龄/车龄发表评论
/a
统计
品牌型号用户名时间评论内容(信息单元)
A
国内品牌
产品信息池
国际品牌
YOrk叶
2002-02-1559:4915:
Xmxm
2002-02-1516:07:50
技术性能评价
出租车司机4000
35/7
154
如果你现在用的高压线工作良
汽车论坛
好9那么即使你一味地加强火星塞的跳活能量9你也得不
到更多的马力输出
大家别急着买9我看还差得远呢9卖八万以内还算合理
价格评论
私企业主
>10000
37/3
54
3.2多层面的典型分析结果户需求统计数据显示平稳9在节假日期间都有规律性下降9此外在波动较大的时候都有针对本车型的事件(例如降价 促销等)发生9导致客户关注度的变化 由图4的累加图可以得到各车型的关注率9关注率的变化同样反应了市场的走向与波动
!长周期市场热点分析1"
选取市场上五款经济型家庭轿车9根据2002-08-01至2002-10-31的信息源数据进行分析 图3 图4为长周期车型关注点击跟踪分析和点击分析累加图 由图3可以看出9在产品成熟期内9客
市场分析 聚类 市场细分
1170计算机集成制造系统
第10卷
!客户产品关注热点分析与相关内容分析2"
选取A和B短周期的客户数据进行产品聚焦
场分析的理论方法 工具开发与应用等进行了积极的探索 参考文献!
1 ar-GUOGuOCing CHENGDOng WANGXiaOdOng etal.M
.Bei ing ChinaRenminUniVerSityketingmanagement M
郭国庆 成栋 王小东 等.市场营PreSS1997inChineSe.销管理 M .北京 中国人民大学出版社 1997. 2 iningOnWebXIEDanxia LIXiaOdOng.ApplicatiOnOfdatam
J .COmputerApplicatiOnS 2002 21 2 anddeSignOftOOlS
谢丹夏 李晓东数据挖掘技术在42-44inChineSe..Web
上的应用及其工具设计 计算机应用 J.200221242-44. 3 DANIELSJJ RISSLANDEL.AcaSe-baSedapprOachtO
intelligentinfOrmatiOnretrieVal A .PrOceedingSOfthe18th
annualinternatiOnalACMSIGIRCOnferenceOnReSearchandDeVelOpmentinInfOrmatiOnRetrieVal C .NeWYOrk NY USA ACMPreSS 1995.
LIUHOngyan CHENJian CHENGuOCing.ReVieWOfclaSSifi-catiOnalgOrithmSfOrdatamining J .JOurnalOfTSinghuaU-Sci Tech 2002 42 6 727-730 inChineSe .niVerSity 刘红岩 陈剑 陈国青.数据挖掘中数据分类算法综述 J .清华大学学报 自然科学版 2002 42 6727-730.
WEIKCNANCESBIPUSKORIUSGV.GainingcOn-SumerinSightSfrOmautOmatedtextualdataanalySiS A .PrO-ceedingSOfInStitutefOrOperatiOnSReSearchandtheManage- mentScienceSINFORMSSpring2000COnference C .
2000.GUOWei ZHENGJiangbO IHaiyan etal.MethOdOlOgyfOrprOductplanningbaSedOnmarketinfOrmatiOn J .JOurnal
OfCOmputer-AidedDeSign COmputerGraphicS2001 13
郭伟 郑江波 齐海燕 等.基于市1 48-51 inChineSe .
场综合分析的产品规划方法研究 J .计算机辅助设计与图形学学报 2001 13 1 48-51.
YEBingCHENYing.ReSearchOnSearchingInternetinfOr-matiOnOftradeprOductS J .COmputerIntegratedManufac-turingSyStemS 2002 8 6 487-490 inChineSe . 叶冰
陈鹰.行业产品的Internet信息搜索研究 J .计算机集成制造系统 2002 8 6487-490.
WANGJicheng PANJingui ZHANGFuyan.ReSearchOnWebtextmining J .JOurnalOfCOmputerReSearch DeVel-Opment 2000 37 5 513-520 inChineSe . 王继成 潘金贵 张福炎.W文本挖掘技术研究 ebJ .计算机研究与发展 2000 37 5 513-520.
分析 如表6所示 分析得出车型A的客户关注度
要高于B 同时 分析表明车型A和B的发动机及机械部件是当前用户都比较关注的结构部件 在表6的基础上 根据分析所确定的所属于产品A的发动机 机械部件和转向结构等客户信息单元集 可引入交互式分析 即由市场销售人员 产品设计人员参加的对信息单元内容的深度分析 以进一步建立完整客户需求
表6车型
评论数量580321
1
产品关注热点对比表
数量客户关注产品热点分析 前5名
2
3
4车轮 54
5变速机构
4 发动机 机械部件 转向结构
AB
241124
发动机 机械部件 126
87
85车身 63
42
变速机构 仪器部件
32
19
5 !其他典型分析3"
将信息源积累的客户基本信息与市场热点分
析 产品关注热点分析等进行聚合分析 可进一步开展潜在客户的购买意向分析 现有客户服务需求与忠诚度分析以及围绕特定产品的内容深度分析等 4结束语
7 6 以Web为载体的信息源 为企业提供了新的动
态跟踪市场与分析客户需求的重要途径 本文在对网络信息源进行深入分析的基础上 利用数据挖掘的理论与方法 建立了完整的基于Web的客户信息获取与处理的理论方法与工具系统 并结合汽车行业进行了具体应用 取得了很好的效果 同时 对利
8 用Web信息源开展动态连续的客户需求分析与市
MethodologyofexploringandanalyzingtheVOcbasedonextensivewebdatasource
Sch.OfMechanicalEng. Tian inUniV. Tian in300072 China
Abstract InOrdertOtrackthemarkettrendSandObtainfullunderStandingOfVOiceOfCuStOmerS VOC aneWmethOdOfanalyZingdynamicprOductinfOrmatiOnthrOughtheWebmediaWaSpreSented.BaSedOntheanalySiSOfadVantageS diSadVantageSOfthediStributedandcOncentratedWebdataSOurce aSyStematicmappingrelatiOnShip frOmtheOriginalWebSOurcetOStructuredmarketingdataSetting WaSeStabliShed.ThenaknOWledgebaSeOrganiZedOnfeatureSOfPrOductSLifecycleStage PLS aSWellaStheinVOlVed
in-CuantitatiVeruleSuSedinclaSSifyingtheVOCinfOrmatiOn WaSdeVelOped.SO therule-driVendatamingmethOdWaSappliedtOidentifythePLSclaSSificatiOnOftheOriginaldatacell.FurthermOrethemethOdSOffreCuencycOuntingandcOntentanalyZingWerecOnductedtOthedatacellcOnSeCuentlySOthatbOthmar-kettrendandaSyStematicunderStandingOfVOCcOuldbeObtained.Finally adetailedprOceSSWaSpreS-entedbyuSingtypicalWebdataOnautOmOtiVeprOduct.Keywords dataSOurce VOiceOfcuStOmer datamining
ReceiVed18Aug.2003 accepted27NOV.2003.
FOundatiOnitem PrO ectSuppOrtedbytheNatiOnalHigh-Tech.R DPrOgram China NO.2003AA415220 .
GUOWei ~UMing-$On
市场分析 聚类 市场细分
基于Web源的客户需求获取及分析方法
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
郭伟, 胡明艳
天津大学,机械工程学院,天津,300072计算机集成制造系统
COMPUTER INTEGRATED MANUFACTURING SYSTEMS2004,10(9)11次
参考文献(8条)
1.郭国庆;成栋;王小东 市场营销管理 1997
2.王继成;潘金贵;张福炎 Web文本挖掘技术研究[期刊论文]-计算机研究与发展 2000(05)3.叶冰;陈鹰 行业产品的Internet信息搜索研究[期刊论文]-计算机集成制造系统 2002(06)
4.郭伟;郑江波;齐海燕 基于市场综合分析的产品规划方法研究[期刊论文]-计算机辅助设计与图形学学报2001(01)
5.WEI K C;NANCES B I;PUSKORIUS G V Gaining consumer insights from automated textual data analysis2000
6.刘红岩;陈剑;陈国青 数据挖掘中数据分类算法综述[期刊论文]-清华大学学报(自然科学版) 2002(06)7.DANIELS J J;RISSLAND E L A case-based approach to intelligent information retrieval 19958.谢丹夏;李晓东 数据挖掘技术在Web上的应用及其工具设计 2002(02)
引证文献(11条)
1.王新海.王志宏 Web客户隐性需求开发模式研究[期刊论文]-情报杂志 2009(1)
2.屠立.张树有 基于最小最大概率机的客户需求分类技术[期刊论文]-农业机械学报 2009(3)
3.崔剑.祁国宁.纪杨建.顾巧详.苏少辉.胡浩 基于客户结构阶层和BP的PLM客户需求[期刊论文]-浙江大学学报(工学版) 2008(3)
4.李君轶.杨敏 基于 Web 数据挖掘的旅游需求分析与预测[期刊论文]-旅游科学 2007(6)5.李益兵.熊志勇.王先轲 基于Web的客户需求获取方法研究与应用[期刊论文]-机械制造 2007(5)6.卢燕津.张昊.杨青海.祁国宁 大批量定制中的客户参与设计[期刊论文]-成组技术与生产现代化 2007(1)7.毛晓莉 浅析电子商务环境下我国旅游企业的客户获取[期刊论文]-昆明大学学报 2006(z1)8.陈丕庞 基于Web信息源的高校图书馆用户满意度测评方法的研究[期刊论文]-科技管理研究 2006(4)9.丁俊武.韩玉启.郑称德 基于TRIZ的产品需求获取研究[期刊论文]-计算机集成制造系统 2006(5)10.朱家诚 基于Web Services的客户定制产品设计系统研究[学位论文]博士 200511.丁俊武 基于创新问题解决理论的产品设计方法及其应用研究[学位论文]博士 2005
本文链接:http://www.77cn.com.cn/Periodical_jsjjczzxt200409027.aspx
正在阅读:
基于Web源的客户需求获取及分析方法08-28
《当幸福来敲门》的英文观后感04-02
铁路框构中桥施工组织设计05-19
高效阅读 王廷启09-03
读《白鹿原》有感1500字12-11
4现代语言学的开创者——索绪尔05-12
人教版八年级英语下册unit1 sectionA 3a课件 ppt.内容01-27
(吕军)课程设计--设计8倍观察镜01-22
不锈钢水箱图集(蓝博水箱)和用途有哪些06-11
2008年7月审计学原理试卷及答案06-02
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 获取
- 基于
- 需求
- 客户
- 方法
- 分析
- Web
- 第9章 投资性房地产
- 钢铁行业生产工艺流程
- 《国家》歌词
- 国开电大管理英语2形考任务7
- 网络规划与设计实训报告
- 最新当代大学生价值观调查问卷
- 2011年高考状元谈学习方法
- 【推荐K12】2018年七年级道德与法治上册第二单元友谊的天空第五课交友的智慧同步测试新人教版
- 糖医帮 试题 答案精选
- 实验:描绘小灯泡的伏安特性曲线(含例题)
- John Milton约翰.弥尔顿的《失乐园》
- 英语四级考试高频短语
- 五线开花金叉选股公式(通信达)有图
- 英文点餐大全
- 2012江苏省研究生工作站项目合作协议(提纲)
- 2018-2024年中国新疆电力行业调研研究报告(目录)
- 国家电网公司环境保护管理办法
- 轴流风机薄板叶型设计方法的比较!
- 电气设备检测综合试验
- 如何设置 - 针式打印机打印241×279mm