18组王越胡冠宇吴尚益数模训练2网络购物分析.docx
- 文档编号:3913097
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:13
- 大小:133.55KB
18组王越胡冠宇吴尚益数模训练2网络购物分析.docx
《18组王越胡冠宇吴尚益数模训练2网络购物分析.docx》由会员分享,可在线阅读,更多相关《18组王越胡冠宇吴尚益数模训练2网络购物分析.docx(13页珍藏版)》请在冰点文库上搜索。
18组王越胡冠宇吴尚益数模训练2网络购物分析
2013年数模训练1
投资计划问题
组号:
18
成员:
王越胡冠宇吴尚益
目录
2013年训练题1:
投资计划问题
摘要
本文通过matlab软件对网购销售数据进行了处理以及分析,解决了网购网站销售产品的问题。
由于本题中的数据量极其庞大,本文先通过excel对数据进行初步处理,然后运用matlab软件对数据进行了优化,得出了999件商品的0—1销售表。
0—1销售表为本文分析的基础数据,本文的相关数据分析均给予基于商品销售0-1销售表。
第一问中,本文基于关联规则对相关性进行了阀值分析,然后通过枚举法对本文的两两关联度进行了分析,同时挑出了其中关联度以及被购买数较多的数据进行了聚类分析得出了相应的相似度的有关结果。
第二问中,本文基于第一问的结果以及特征商品对多个商品直接的关联度进行了分析,同样的运用matlab软件对数据进行枚举分析,得出相关度较高的组别。
最后,在第三问中,本文选取了前两问关联度分析中的二维、三维以及四维数据对不同商品组合之间的利润进行了运算。
同时运用相应的评价规则对商品的可行促销方案进行了分析,得出了相应可行且利润较优的促销方案.
总体而言,本文通过matlab以及spss等数学统计软件运用关联规则以及穷举法解决了网购网站商品购买关联度以及促销的问题,在一定程度上为网购网站的经营提出了一定的方案。
一、问题重述
如今,“网购”已成为人们生活的一部分。
由此成就了一批优秀的购物网站,如天猫,京东,当当,亚马逊等。
在购物的同时,人们的购物记录被保留在网站数据库内。
网店老板经常关心的问题是顾客的购物习惯。
他们想知道:
“什么商品组或集合顾客会在一次购物时同时购买”。
他们可以把这些“同类商品”相互关联在网页内,以便于顾客浏览商品,引导顾客消费,进而增加销量。
已知某购物网站一段时期所有顾客购买物品的清单和相应商品的利润,需要你们给网店老板一个合理的顾客购物习惯分析报告,并提供一个促销计划的初步方案。
问题1附件1中的表格数据显示了该网站主要购物数据,一段时期内4625个顾客对999种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的网站内部编号。
试建立一种数学模型,该模型能定量表达网站中多种商品间的关联关系的密切程度。
问题2根据你们在问题1中建立的模型,寻找一种快速有效的方法能从附件1中数据分析出哪些商品是最频繁被同时购买的。
网站老板希望得到尽可能多的商品被频繁同时购买的信息,所以你们找到的最频繁被同时购买的商品数量越多越好。
例如:
如果商品1、商品2、商品3,商品4在4625个购物记录中同时出现了200次,则可以认为这三个商品同时频繁出现了200次,商品数量是4。
问题3附件2给出了这999中商品的对应的利润,试根据你们在问题1、问题2中建立的模型,给出一种初步的促销方案,使购物网站的效益进一步增大。
二、模型假设
1.题目给出的统计数据真实有效。
4.短时间内商品的销售情况不变。
3.表格中的数据能真实有效地反映当地消费者的购物情况。
2.问题三中,各个商品的利润保持不变。
三、符号说明:
(未列出符号将在文中进行进一步说明)
n
消费者的数量
人i是否购买了商品j。
1—购买0—未购买
对第i个消费者的消费行为的描述
第j种商品被n个消费者购买的情况
j、k两种商品的相关性(是对商品j和k有相同购买行为的消费者在总共n个消费者中所占的比例)
在购买了商品j和k中至少一种的消费者中,同时购买了两种产品的比例
=1-
差异性的距离度量
包含了p个不同的商品的第一小类
包含了另外q个不同商品的第二小类
小类AB之间的距离
四、问题分析
问题一:
问题一本质为商品分类问题,本题中我们设定的商品分类标准为其关联度属性。
本次试验,我们运用聚类分析与apriori算法相结合的方式,采用商品支持度来度量商品关联度。
进而定义商品类别之间的距离,从而进行分组聚类,描述商品的关联度。
问题二:
本题中,对问题一模型进行了简化和修改,利用穷举法对于两种商品组合、三种商品组合、四种商品组合购买人数进行筛选。
其中在三种和四种商品购买人数测定过程中,设计阀值,利用两种商品组合购买人数额分析结论,确定频繁项组,以此减少循环次数,保证程序的可执行性。
问题三:
利用商品组合方案,计算商品组合利润,寻求利润最大、销量最大的最优商品组合。
同时,结合单位商品利润,制定相关促销方案。
5、模型的建立
问题一:
基于0-1变量的聚类方法——apriori算法改良:
本题中,我们将购物篮中商品的相关性予以分析,并根据其相关性的大小予以聚类。
1、数据优化
我们关注于p种不同产品的相关性。
我们用向量
描述第i个消费者某次购买行为。
其中,若第i位消费者购买第j种商品,记
=1;否则
=0。
若消费者总数为n,则定义向量
刻画第j种商品被n个消费者购买的情况。
若
由大量的1构成,j商品被消费者购买的频率很高。
为了刻画多种商品的关联度,我们定义支持度
及信度
支持度
:
表示对商品j和k有相同购买行为的消费者在消费者总数中的占比。
若
值很大,说明商品j和k具有强相关性,应被聚为一类,否则说明相关性较弱。
信度
描述消费者i购买j或k的前提下同时购买j、k商品的条件概率。
指标
度量消费者一旦决定购买商品j或k后,购买j、k两种产品可能性的大小;若
较大,则
j、k两种商品的相关性很大,应被聚为一类;否则这两种商品的相关性很小。
根据关联度的度量,定义距离
=1-
来获得关于差异性的距离度量,即相关性越大,距离越小。
上述的距离定义仅仅适用于两种具体的商品。
在分层聚类的过程中,距离最近的,相似性最强的商品被首先聚为个各“小类”。
在此基础上,再将相似的“小类”聚为“大类”。
本题中,我组采用平均链接法定义“类”与“类”之间的距离。
假设我们有两个“小类”,记为:
和
。
即:
第一个“小类”中总共包含了p个不同的产品,而第二个“小类”中包含了另外q种产品。
平均链接法:
利用距离和关联度两个指标,建立模型得出数据,即可定量表达网站中多种商品间的关联关系的密切程度。
第二问:
利用matlab编程(程序见附录)对优化后的购买数据进行聚类分析,结果如下:
1、两种商品组合购买分析
编号1
编号2
人数
120
368
329
145
217
329
205
368
307
217
419
289
217
368
289
217
529
286
217
829
286
362
368
280
368
413
258
368
419
256
表一两种商品组合购买记录
表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中120与368商品的购买组合为最频繁购买组合,商品数2,频繁出现329次。
2、三种商品组合购买分析
商品1
商品2
商品3
人数
217
368
529
101
217
368
541
79
217
368
489
77
217
266
368
70
217
368
692
69
217
682
914
69
217
489
529
68
217
890
914
68
217
368
690
66
217
657
956
66
表二两种商品组合购买记录
表二截取了三种商品购买记录前10位的商品,有表二可以看出,三种商品的购买组合中商品217、商品368与商品529的购买组合为最频繁购买组合,商品数3,频繁出现101次。
同时有表二,还可以发现,出现最频繁的商品组合均含217号商品,证明217号商品在所有商品中购买量较大。
3、四种商品组合购买记录
商品编号1
商品编号2
商品编号3
商品编号4
购买人数
217
368
529
690
55
217
368
176
690
54
217
368
266
529
53
217
368
176
529
51
217
368
266
690
51
217
368
529
571
51
217
368
690
266
51
217
368
571
690
50
217
368
176
266
49
217
368
176
571
49
表三四种商品组合购买记录
表一截取了两种商品购买记录前10位的商品,有表一可以看出,两种商品的购买组合中商品217、商品368、商品529、商品690的购买组合为最频繁购买组合,商品数4,频繁出现55次。
问题三:
编号1
编号2
人数
利润
总利润
120
368
329
502.02
165164.58
368
419
256
587.93
150510.08
205
368
307
479.64
147249.48
368
529
255
575.95
146867.25
368
692
247
587.93
145218.71
368
438
256
565.29
144714.24
368
720
247
581.82
143709.54
368
752
246
581.82
143127.72
419
720
227
587.93
133460.11
368
956
236
555.12
131008.32
表4两种商品购买组合利润
表4截取了两种商品购买记录利润前10位的商品,由表4可以看出,两种商品的购买组合中商品120、商品368的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.
商品1
商品2
商品3
人数
组合利润
总利润
217
368
529
101
581.1588
58697.0388
217
368
692
69
568.6388
39236.0772
217
368
541
79
484.8488
38303.0552
217
368
401
63
581.1588
36613.0044
217
657
956
66
554.4588
36594.2808
217
145
529
61
575.2888
35092.6168
217
529
692
61
562.7688
34328.8968
217
368
690
66
489.5888
32312.8608
217
914
368
61
489.5888
29864.9168
217
368
489
77
301.3276
23202.2252
表5三种商品购买组合利润
表5截取了三种商品购买记录利润前10位的商品,由表5可以看出,三种商品的购买组合中商品217、商品368、商品529的购买组合同时满足利润最高及购买次数最频繁,为最优商品组合.
商品编号1
商品编号2
商品编号3
商品编号4
人数
组合利润
总利润
217
368
176
529
51
872.0688
44475.5088
217
368
529
690
55
681.1528
37463.404
217
368
176
690
54
687.0228
37099.2312
217
368
176
571
49
669.8378
32822.0522
217
368
266
571
48
669.8378
32152.2144
217
368
266
529
53
605.5078
32091.9134
217
368
176
266
49
611.3778
29957.5122
217
368
541
642
42
678.3188
28489.3896
217
368
489
529
43
586.3676
25213.8068
217
368
571
690
50
478.9218
23946.09
表6四种商品购买组合利润
表6截取了三种商品购买记录利润前10位的商品,由表6可以看出,四种商品的购买组合中商品217、商品368、商品529、商品176的购买组合利润最高,虽然此种组合购买人数并非最多,但考虑到超市利润最大化的经营目标,将此组合作为最优商品组合。
由以上购买组合利润分析得知,217和368号商品分别出现在三种及四种商品的最优销售组合中,同时在两种商品的购买组合中,217和368号商品组合也位于频繁购买的前十位。
217号商品单位利润5.2088,属于利润较低的商品。
368号商品单位利润290.91,属于利润较高的产品。
购买组合分析可知,217号商品与368号等其他商品关联度较高,217号商品销售量增加可带动其他商品销售量大幅上升。
因此,商家可对利润较低的217商品采取一定的促销措施,利用217商品销量上升,带动368等高利润商品销量上升,进而促进销售额与总利润的增长。
六、模型优缺点及改进方向
聚类方法:
(一)模型优点:
1、
(1)问题一中聚类分析模型的优点为直观,结论形式简明。
算法思路比较简单,以递归统计为基础,易于实现。
引入关联规则中的支持度与信度计算商品关联度,设置最小支持度与最小信度的阀值,简化了计算,使商品关联有了科学度量。
(2)问题二中,使用穷举法,程序设计简单易行。
对穷举法进行简化,减少了循环次数,增强了程序的可执行性。
(二)模型缺点:
(1)问题一中通过距离表达两者之间的相关程度的算法的一个共同特点是某个模式一旦划分到某一类之后,在后继的算法过程中就不改变了,而简单聚类算法中类心一旦选定后在后继算法过程中也不再改变了,这类方法效果一般会产生误差而使结果不会太理想。
(2)问题二中,对于穷举法进行的简化和筛选,造成了高维计算的相关误差,使结果产生误差。
(三)改进方法:
(1)结合动态聚类方法。
动态聚类的优点在于算法简单,运用收敛在数据点分类过程中按照某种准则动态调整数据点类型归属。
该算法是能达到很好聚类结果的,能使各模式到其所判属类别中心距离(平方)之和为最小的最佳聚类。
(2)运用统计计算,寻求最优支持度、信度阀值,以减小其带来的计算误差。
(3)运用抽样技术对商品进行抽样调查,减少运算与调查成本。
(4)加入购买者的购买能力指数权重使促销对象更加具有针对性。
七、参考文献
[1]王汉生等超市零售商品的购物篮分析
[2]周义仓赫孝良(编写)数学建模实验西南交通大学出版社1999.10
[3]李伯德数学建模方法甘肃教育出版社2006.05
8、附录
通过前文中所选取的相应特征商品,为了探究这些高购买量的商品之间的性质,在这个部分本文通过spss软件对这些商品进行聚类分析得到如下结果(聚类过程详见附件):
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 18 组王越胡冠宇吴 数模 训练 网络 购物 分析
![提示](https://static.bingdoc.com/images/bang_tan.gif)