超级市场零售商品的购物篮分析

更新时间:2024-05-15 03:32:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

优秀论文参评与交流稿

超级市场零售商品的购物篮分析

王汉生、江明华、曹丽娜、金英

11121北京大学光华管理学院,中央电视台广告部

2摘要 本文利用国内某中型城市中,处于垄断地位的一个大型超市的26天的销售流水数据对消费者的购物篮中商品的相关性进行了探索性研究。具体地说,我们首先介绍了一个基于0-1变量的聚类方法,可以被用来做典型的菜篮子分析;然后,我们用此方法详细分析某中等城市的一个大型连锁超市数据。对消费者购物篮中商品的相关心进行了探索性的研究。 关键词:消费者行为、购物篮分析、0-1变量、聚类分析

0问题提出

首先,现代零售商品种类极端丰富,消费者需要处理的信息量急剧增加。消费者平均要以每秒33件的速度从5万件商品中挑选出17件商品。Phillips(2005)的研究表明,当消费者面对种类繁多的商品时,并不会应为可选择的丰富多样性而得到满足。但是,消费者却能够因为超市对其商品选择的引导而感到满意。超市引导的一个办法就是通过商品的布货,也即,哪些商品可以摆放在一起,而哪些商品又应当分别摆放。问题是,超市进行布货的依据是什么?

其次,我们可以观察到商场和超市经常进行各种促销,其中最常见的促销方式是打折,而且,常常是全场打折。这样的打折往往不是超市最优的选择。因为,消费者在购买某些商品的时候,会同时购买另一些商品,而不管它们是否是在打折。在这种情况下,只要这两种商品之一处于打折状态,往往会刺激消费者购买两种商品。这样,超市只需要对一种商品打折就可以达到促销两种商品的目的,从而可以大大提高超市的效益。问题是,超市安排商品打折的依据是什么?

因此,基于上述原因,了解消费者究竟如何在多商品类目间进行同时选择(Simultaneous Selection)对于超市如何有效地引导消费者和提高效益意义重大。所以,本文的目的有二。第一、介绍一个简单而有效的数量方法,可以被用来做典型的菜篮子分析;第二、用此方法详细分析某中等城市的一个大型连锁超市数据,从而探索大陆消费者的相关行为特征。

以下章节如下安排。下一节,详细介绍一个基于0-1变量的聚类方法。基于此方法的实际数据分析将在第三节中展开。最后是总结与讨论。

1文献研究

在过去的研究中,Fader和Lodish(1990)研究表明某些消费者特征(如Household Penetration和购买频率)对零售商品定价和促销环境具有一定的解释能力。Narasimhan等人(1996)的进一步研究发现,一类商品的促销弹性部分取决于该类商品的品类结构和相关消费者特征。Raju(1992)研究了不同类商品销量差异性,并建立了它同品类特征和营销组和变量的关系。Hoch等人(1995)则研究了各类商品的商店价格弹性(Store-Level Price Elasticities)和所在商圈消费者人口统计特征的关系。Manchanda等人(1999)则进一步

1

同通过多层Bayesian Probit模型研究了不同类目商品之间对消费者购买行为的相互影响。

以上研究,一方面为人们理解消费者的超市购物行为提供了很多有意义的理论依据以及现实证据。但是另一方面,他们所研究的消费者群体据来自于欧美发达国家,其对于中国大陆广大消费群体的代表性值得怀疑。而另一方面,随着中国大陆经济的迅速腾飞,人们生活水平的快速提高,以超市为代表中国大陆零售商品市场正在飞速发展。面对这样一个迅速崛起的巨大市场,一方面各大国际知名超市企业(如:沃尔马、家乐福)迅速进入中国并快速发展,而另一方面给予消费者行为的微观数据分析却非常缺乏。在过去有限的研究中,人们往往把注意力集中在了相对宏观的层面上,或者纯粹的数量技术模型上。而本文的试图通过翔实可靠的超级市场消费者行为数据,对大陆消费者的购物篮予以探索性分析。

购物篮指的是超级市场内供顾客购物时使用的装商品的篮子,当顾客付款时这些购物篮内的商品被营业人员通过收款机一一登记结算,所谓的购物篮分析就是通过这些购物篮子所显示的信息来研究顾客的购买行为。消费者的购物篮隐含着重要的有价值的信息,等待人们去发掘。如:我们可以知道消费者的购买习惯、产品偏好、品牌忠诚度等等。而本文尝试通过合理的数量方法,研究产品的相关性。也就是说,我们关心的问题是那些产品互相之间具有很强的相关性。从而我们知道,当一个消费者购买其中一个产品的情况下,极有可能同时购买另外一个产品。这对于超市合理定价促销有着重要的指导意义。此类研究在国外已有成功案例,而国内市场营销界的文献资料中则很少见到。

2基于0-1变量的聚类方法

简而言之,我们的目的就是要对购物篮中商品的相关性予以分析,并根据其相关性的大小予以聚类。假设我们关注于p种不同产品的相关性。对于第i个消费者,我们可以用向量

xi??xi1,?,xip?来描述他的某次购买行为。其中,xij?1,如果在该消费者的购物篮中发

现了第j种商品,否则xij?0。假设,我们有总共n个消费者,那么我们可以定义向量

vj??x1j,?,xnj?。该向量刻画了第j种商品被n个消费者购买的情况。如果,vj由大量的

1构成,那么我们就知道该商品被消费者购买的频率很高。另一方面,如果vj由大量的0构成,那么我们就知道该商品被购买的频率很低。

另外,如果有两个共同的商品j和k,我们还可以通过比较向量vj和vk的相似性来获得对他们相关性的度量。具体地说,如果我们发现vj和vk的各个分量非常相似,这说明商品j和k很容易被同时购买,或者被同时不购买。因此,我们可以粗糙地认为这两种产品的相关性很强。因此,我们第一种度量商品相关性数量指标定义如下:

1nrjk??I?xij?xik?,

ni?1其中示性函数Ixij?xik?1,如果确实有xij?xik;否则Ixij?xik?0。简单地说rjk就是对商品j和k有相同购买行为(同时购买,或者同时不买)的消费者在总共n个消费者中

2

????所占的比例。因此,如果rjk值很大,这说明商品j和k的相关性很强,因此应该被聚为一类,否则说明相关性很弱。

但是,遗憾的是这个度量在实际数据应用中并不理想。主要原因在于对于超市数据,对于任意两个产品我们都能否发现他们有很大的rjk值。这并不说明人以两个产品的相关性都很强,而是由于产品种类繁多,大多数消费者都会同是不购买这两种产品,因此造成

1nI?xij?xik?0? ?ni?1的值很大。因此,我们转而考虑如下相关性度量:

sjk??I?xi?1nij?xik?。

?I?xi?1nij?xik?0?请注意,由于xij和xik为取值只可能为0或者1的0-1变量,因此条件xij?xik?0隐含着xij和xik中至少有一个取值为1。也就是说,商品j和k中至少有一种被第i个消费者购买。因此,

?I?xi?1nij?xik?0?计算了n个消费者中,有多少人至少购买了商品j和k中的一种。那

么,指标sjk就度量了在购买了商品j和k中至少一种的消费者中,有多少消费者同时购买了两种产品。由此可见,如果sjk很大,这说明消费者一旦决定购买商品j和k中任何一种,那么另外一种就也有很大可能性被同时购买;进而我们知道,这两种商品的相关性很大,应该被聚为一类,否则相关性很小。一旦有了相似性的度量,我们就可以通过变换djk?1?sjk来获得关于差异性的距离度量。

值得注意的是,以上的距离定义仅仅适用于两种具体的商品。在分层聚类(Hierarchical Clustering)的过程中,距离最近的,相似性最强的商品被首先聚为个各“小类”。然后,我们需要在此基础上,再将相似的“小类”聚为“大类”。因此,我们需要定义“类”与“类”之间的距离。假设我们有两个“小类”,记为:A?i1,i2,?ip与B?j1,j2,?,jq。即:第一个“小类”中总共包含了p个不同的产品,而第二个“小类”中包含了另外q种产品。研究中常用的定义“小类”A和B之间距离的方法有以下三种:

单连接法(Single Linkage):

????dAB?mindjajb:1?a?p,1?b?q

完全连接法(Single Linkage):

??dAB?maxdjajb:1?a?p,1?b?q

?? 3

平均连接法(Single Linkage):

dAB1pq?djajb。 ??pqa?1b?1简单地说,单连接法要求比较弱。只要两个“小类”中有两个产品相似,那么单连接法就会

认为这两个“小类”非常相似。而完全连接法则不然。根据定义,完全连接法要求两个“小类”中的所有产品都相似,这两个小类才可以被称为相似。而平均连接法则居于单连接和完全连接中间。对于各种连接方法的详细讨论,可以参阅Johnson和Wicherm(2003)。对于我们的超市数据,以上三种连接方法都有所尝试,最后发现完全连接方法最为适合。

3实际数据分析

本文中所采用的数据来自于我国北方某中型城市,处于垄断地位的某大型连锁超市26天的销售流水数据,共65,535条记录,主要包括交易代码,交易时间,商品代码,商品名称,销售数量,销售金额等等。交易定义为顾客的每次购买行为,也即是一个购物篮,一次交易涉及一个或多个商品,一条销售记录指一次交易中某种商品的销售数量和金额。其中有效销售记录为65,348条,其余187条销售记录所对应的商品并未包含在商品基本信息数据库中。而这65,348条有效销售记录来自于10,216笔交易,即包含了10,216个购物篮的商品信息。这些购物篮中共包括了总共4,833种商品,其平均购买金额为40.48元。

在发生销售的4,833种商品中,有2,989种商品的购买频率不超过5次。一般来讲,顾客购买频率较高的商品对于超市也具有更加显著的经济意义,这些商品的价格及销售量的变动将显著影响到超市的效益。而顾客购买频率最高的前50种商品(占所有发生销售商品种类的1.03%)的销售金额约为9万元,占总销售额的21.75%,具有很好的代表性,而且对超市意义重大。因此,在本文的分析中,我们将选择顾客购买频率最高的前50种商品进行分析。为直观起见,我们将处于销售频率前十位的商品描述如表1所示。更加详细地描述性分析可以在表2中找到。

表1:销售金额最高的十类商品

排序 1 2 3 4 5 6 7 8 9 10 合计

商品类别 鲜猪肉 色拉油 散蛋类 盒装白酒 果汁 洗发类 散粮 纯牛奶 蔬菜类 白面

销售金额(元)

22121.9 14849.3 10769.2 9820.6 9179.4 9152.2 8769.1 8734.1 8233.5 8153.3 109782.6

占总销售额的百分比

5.35% 3.59% 2.60% 2.37% 2.22% 2.21% 2.12% 2.11% 1.99% 1.97% 26.55%

利用整理好的数据,采用0-1变量距离进行聚类分析,分别采用单连接法、完全连接法和平均连接法,经过比较发现完全连接法的结果最为显著,所得到的聚类结果的树状结构图(参加图1)。从中可以看出,这50种商品最终被划分为8类。最为相似的两种商品是“主

4

食厨房”和“生鲜蔬菜”两种商品。其次,是“仙岛增鲜酱油1级380ml”和“新碘盐500g”,主食与蔬菜同时购买,比较符合家庭的购买习惯,酱油与盐则同时属于烹饪调味料。值得注意的是我们发现“260克三鹿纯牛奶”与“伊利百利包纯牛奶”也表现出了很强的相关性。从图1可以看到,它们之间的距离约为0.88,这隐含着相关性强度为sjk?1?0.88?12%。这说明,一旦一个消费者决定购买这两种不同品牌牛奶中的任何一种,有12%的可能性会同时购买这两种牛奶。

4总结与讨论

我们通过对超市消费者的购物篮进行分析,发现了一些很有意义的现象。有的是我们可以预见的,例如,仙岛生鲜酱油与新碘盐的高度相关性,而有些则是出乎我们意料的,例如,三鹿纯牛奶于伊利纯牛奶。发现这些相关性,对于指导未来的超市经营管理具有一定的借鉴意义。例如,可以考虑对高度相关产品的某一种大力促销,而对另外一种保持原价,甚至提高价格。消费者会因为其中打折促销产品的诱惑而光顾超市,但是他们会除了购买打折产品以外,还会购买与之高度相关的产品。而超市由于促销所损失的利益,可以由此而获得相应的甚至更多的补偿。

另外一方面,本研究也存在一定的局限。我们却无法对此行为背后的原因予以分析。造成该局限性的一个原因在于数据的局限性。由于绝大多数消费者拒绝透露个人信息,我们无法获得该消费者的人口特征信息。我们深信,对于消费者个体信息的获得会极大地提高本研究的价值,这是我们未来努力的方向。

参 考 文 献

[1]. Fader, P. and Lodish, L. M. (1990) “A cross-category analysis of category structure and promotional activity

for grocery products”, Journal of Marketing, 54, 52-56.

[2]. Hoch, S. J., Kim, B. D., Montgomery, A. L. and Rossi, P. E. (1995). “Determinants of store level price

elasticities”, Journal of Marketing Research, 32, 17-29.

[3]. Johnson, R. A. and Wichern, D. W. (2003). “Applied Multivariate Statistical Analysis” 5th ed. Pearson

Education, Hong Kong. P. R. China.

[4]. Manchanda, P., Ansari, A. and Gupta S. (1999). “The ?shopping basket?: a model for multicategory purchase

incidence decisions”, Marketing Science, 18, 95-114.

[5]. Narasimhan, C., Neslin, S. A. and Sen, S. (1996) “ Promotional elasticities and category characteristics”,

Journal of Marketing, 60, 17-30.

[6]. Phillips, H. (2005) “Theory and reality of choice in retail markets”, Consumer Policy Review; May 15,

99-103.

[7]. Raju, J. S. (1992) “The effect of price promotions on variability in product category sales”, Marketing

Science, 11, 207-220.

5

图1:聚类结果树状图

6

表2:聚类分析中顾客购买频率最高的50种商品

商品名称 生鲜蔬菜 主食厨房 鸡蛋 挑李现场制作面包蛋糕 新腆盐 500克 仙岛增鲜酱油一级 380ml 散大米 自制糖蜜果 水果(燕大) 带皮前槽 豆制品 糕点 散白糖 豆浆 素拌菜 带皮后丘 永真香油麻酱现场制作 统一鲜橙多鲜橙汁饮料 330ml 涮羊肉调料 150g 白薯粉 大宝SOD蜜 100ml 仙岛二级增鲜酱油 380ml 伊利百利包纯牛奶 227ml 可口可乐 双汇鸡肠 30g*10 购买频率(次) 5126 1563 1073 659 568 520 486 453 450 425 392 380 344 334 333 319 281 272 256 235 223 219 213 211 209 销售金额(元) 7924.30 2851.81 9701.24 2162.69 728.78 770.40 6832.42 1296.29 4996.96 6676.18 1137.87 2111.21 1131.93 725.66 840.96 6284.41 2226.50 777.00 315.90 585.38 1107.50 267.00 1365.60 1600.80 629.30 商品名称 超级六丁目五连包香辣牛肉95gX5 盼盼蛋黄派 500克 洽洽怪味豆 52g 秦大鸡肉丸 300克 散胖哥汤圆 小康家庭100红烧牛肉95克 南峰园鸡蛋面 300克 秦大香辣鸡柳 300克 散花生米 纯滴大豆色拉油51 铁山植(山植精卷) 开口酥 京京小孜然烤肠 400克 华龙小康100五连包香辣面95克x5 双汇香脆肠 225克 汇源10%真鲜橙 500ml 华龙小康家庭100红烧排骨面五连包95克X5 仙岛果糖醋 380ml 庞业酱菜 麻辣拌 雪豹高级鞋油 335克(黑) 三鹿纯牛奶 250g 盼盼真实惠家庭号薯片 152克 亲亲大薯片 120克 福临门色拉油 51 购买频率(次) 205 201 190 189 181 180 179 178 176 174 170 168 167 167 162 161 158 158 157 154 142 142 141 141 141 销售金额(元) 564.60 1011.90 187.60 447.00 858.81 553.10 395.70 579.30 766.95 6246.80 611.80 505.11 836.40 503.00 531.40 1291.50 494.40 150.40 392.94 1185.11 137.70 627.60 262.80 193.50 5573.00 7

本文来源:https://www.bwwdw.com/article/pl07.html

Top