基于Apriori算法的电子商务个性化推荐系统研究

更新时间:2023-06-16 07:02:54 阅读: 评论:0

第22卷第6期重庆科技学院学报(自然科学版)2020年12月基于Apriori算法的电子商务个性化推荐系统研究
陶庆凤
(闽南理工学院实践教学中心,福建石狮362700)
第十人理论摘要:研究基于April算法的电子商务个性化推荐系统。通过该系统,可以实现对电商的日常交易行为大数据的挖掘,并为用户量身定制推荐相关内容。实现该系统的关键是,在大型存储库中发现关联规则,并通过修改后的Apaoa技术将关联规则转换为用户偏好推荐。在此基础上,根据权重对算法进行优化剪枝,以降低算法的复杂度,提高算法的实时性。
关键词:个性化;ApAoa算法;数据挖掘;电商系统明基西门子手机
中图分类号:TP393文献标识码:A文章编号:1673-1980(2020)06-0062-03
近年来,电商平台一直致力于通过海量的用户数据分析来深入了解客户的需求和期望,分组定义现有客户和潜在客户,从而强化营销策略的有效性及公司市场份额[1]o在互联网大数据的背景下,运用有效的数据挖掘和知识发现方法来实现对用户偏好的精准挖掘,也是电商公司的核心竞争力之一⑵'目前,市场上已出现了多种推荐系统[3-5]o推荐系统的主要任务是,推荐客户和选择合适的客户,预测特定客户对特定产品的喜好程度,以及识别客户感兴趣的产品列表。
Ozmutlu等人的研究表明,通过泊松采样选择的样本集统计数据能有效地代表整个数据集的特征,通过数据挖掘算法的聚类分析可识别某些相似度较高的实体组Schafer等人提出了一种使用聚类技术发现群组的不同方式[7]。这两项研究中的算法都是基于相似性度量的不同定义来表示用户之间的亲密度,也可以根据用户执行的交易类型对其进行分组[8]。吴雅琴等人基于\-means的算法研究引入了一种聚类挖掘算法⑼,能够有效地提高聚类质量和收敛速度,解决\-means聚类算法容易陷入局部最优陷阱的问题。现有的算法研究多基于海量数据进行分析和挖掘,复杂度相对较高,所需数据特征较多;而用于中小型网站时,由于没有足够的数据积累,其实时,性、推荐效率都大受影响。1Apriori算法简介
Apaoa算法是Agrawal提出的用于查找关联规则的一项核心技术+10打该算法最典型的应用是,从关系型数据库中挖掘出关联的有效信息。例如,当
75%的用户购买商品1和商品2时,他们是否为同
一类用户,或者是否会对商品3和商品4感兴趣+11「12,°该算法通常分2个阶段运行:
第1阶段,生成具有最小支持项(频繁项目集)的所有项目集。在该阶段,利用的是频繁项目集的向下闭合特性,即如果大小为\的项集是频繁项集,则下面相同大小的所有项集也必须是频繁项集。通过加强约束条件,一所有候选项集大小相同的子集必须存在于频繁项,可以从\频繁项集的集合中生成大小为
\的候选项集。
第2阶段,从所有频繁项集的集合中生成规则。
原始Apaori算法的伪代码如下:
L1=j larae1-itemts,;
for(k=2;L,=0;\++)do beyin
采购管理制度及采购流程
C(k)=apaoa一gen(L(k-1));//New candi­dates
C o all transactions do beyin
C t=subt(C\"t);/Candidates contained in t
C o all candidates c i n C(t do
end
收稿日期:2020-06-23
基金项目:2019年度福建省教育厅中青年教师教育科研项目“基于虚拟现实(VR)的手势控制器开发$(JAT190880)作者简介:陶庆凤(1983-),女,实验师,研究方向为系统开发、实验教学与管理。
・62・
陶庆凤:基于April算法的电子商务个性化推荐系统研究
二{c.count>minsup(;
end
在原始Apfof算法中,apaoa-go是由2个阶
段(合并和剪枝)组成的函数。在合并阶段,需要生成所有\项集频繁项集。
原始ApfoX的合并算法伪代码如下:
insaO into C(顶棚装修效果图
lect y.iteml,•…,p.itemkl,q.item\fem L (\-1)P"
L(\-1)q where.iteml二q.iteml,•…,p. item(\)=q.item(\,
p.i tem(\)lq.item!\)
接下来是剪枝阶段,剪枝阶段会将上一步骤即联合阶段中生成的所有候选者的非频繁项集进行移除。剪枝流程的算法如下:
for all itemts c in C(\)for all(\)subts s of c do
I s L.\then delete c fem C(\)
全国普通话成绩查询网在实际应用中,传统的ApfoX算法存在以下不足[13-14]:
(1)生成的频繁项集其实具有预判能力,可以判别其不符合要求的特点,但仍需对这类候选频繁项集进行扫描,增加了时间开销’
(2"整个连接程序中的重复项目太多,时间复杂度较高,剪枝效果不明显,导致效率较低。
(3)在生成频繁项集之后需要进行回溯,才能够进一步判断频繁项集的判定是否准确,存在重复计算的问题。
针对算法的不足,本次研究将对其加以改进,在此基础上开发一种应用于中小型电商网站的基于用户行为的个性化推荐系统。改进的算法中考虑了基于信息系统的用户核心购买行为,利用加权参数对关联规则进行剪枝,从而在保证为用户选择量身定制商品列表的同时降低算法的复杂度。
2基于Apriori算法的推荐系统实现
传统的Apeoe算进行改进,
实现自动个性化推荐系统的开发。在算法中设置了权重指数,用来反映用户的商品偏好,计算并确认每个交易商品是否为频繁项集。当权重值达到阈值时,即停止计算并且删除权重为0的商品。计算公式如下:
WS;=WS(_1)+(C;+W)(1)式中:WS;为关联•频繁项集的综合权重;C;为关联•的频繁项集集合;W为第/个频繁项集的权重。
系统实现推荐的过程如下:
(1"获取数据库中某用户的最后“笔交易数据,分别计算出项集中具体商品的交易次数。
(2)根据式(1)计算出综合权重(WS),判断其取值是否到达阈值。如果WS达到阈值要求,则停止操作;否则,继续完成下一轮"笔交易的操作,直到WS达到阈值要求为止。
(3)WS为0达不小值mDnsup 的项集予以删除,使一项级高频项集重新组合成二项候选集。对所有项集进行同样操作。
培训总结模板(4)的项作为化推
的商品项集’
3算法测试及结果分析
搭建了一个小规模图书电商平台,对本次基于权重分量的ApfoX算法进行测试。在此平台上,通过购买开源数据集的方式,获取了大约80万条数据。其中,浏览数据有40万条,用户收藏夹数据有20万条,购买数据有8万条。根据上述历史数据集,运行本次改进的ApfoX算法,生成推荐模型和规则。在算法测试中,用2组测试作为对比组:第1组,是在电商网站中没有加入任何产品推荐功能;第2组,是在电商网站中加入了传统Apfori算法。在电商网站上进行为期30d的测试:前10d运行中没有加入任何产品推荐功能冲间10d运行传统Apf-l推荐算法;最后10d运行本次改进算法。以此保证每种算法运行中的稳定性,提高实验数据和样本的可靠性。采用准确率(P y)和召回率(F)来衡量算法的有效性。同时定义:TP为本次推荐且用户实际购买的商品,其数量为C tp;FP为本次推荐但是用户并未购买的商品,其数量为C fp;FN为网站未推荐但用户却购买了的商品,其数量为C f N O其关系式为:
P f=C TP/(C TP+C FP)(2)
C T/(C T+C F N)(3)
算法测试效果对比见图1。从准确率来看,本算法的准确率更高,比传统ApfoX算法的推荐更加精准。对于召回率,没有推荐功能的网站参与测试对比,仅对比了其他2种算法的效果。从召回率来看,在前几期运行中,本算法比传统ApfoX算法稍有逊色;但是,随着训练数据的增加,本算法的效果逐渐提升,最后结果显示优于传统Apaoa 算法。
-63-
陶庆凤:基于Apriori 算法的电子商务个性化推荐系统研究
876543210
123456789 10
时间/d a 准确率6 5
4
3 2 1 0
0 0 0 0 0 0&/<;回 ¥
本算法
0 1 2 3 4 5 6 7 8 9 10
时间/d b 召回率
图1算法效果对比
4结语
传统Apriori 算法进行优化改进,在此基础上
开发了基于 用户行为的 化推荐Apriori 系 统,引入推 重这一 ,用来 统生成最佳
的用户推 品 。系统 的 是,在 ! 存储库中发 规则,并通过修改后的Apriori 技
规则转换为用户偏好推荐。通过 数据试,采用 率
率作为
进行分析,
次改进算法的应用
参考文献
& 1 ]袁晓建,张岐山,甘智平,等.Apaori 算法的改进及在电
商务中
&J ] •福州大学学报(自然科学版),
2018,46(3) :330 -334.
:2:贾玉罡.基于协同过滤的电商推荐系统的设计与实现
:J ] •数字通信世界,2018,159(3) :255.
& 3 ] 文,叶水生•电子商务推荐系统中的协同过滤推荐
:J ] •计算机技术与发展,2006,16(9) :70 -72.
:
4:黎超.基于大数据的电商个性化推荐系统分析:J ].商
业经济研究,2019,765(2) :71 -74.
:5 ]胡敏,陈元会潢宏程.基于用户隐式行为特征的最大爛推
荐算法&J ].计算机工程与设计,2019,40(2):112-118.气虚吃什么好
& 6 ] OZMUTLU  H  C , SPINK  A , OZMUTLU  S. Analysis  of  Laee
Date  Logs : An  Application  of  Poisson  Sampling  on  Excito
软件系统包括什么Web  Queries  & J  ]. Information  Processing  & Management ,
2002,38(4) :473 -490.
&7] SCHAFER  J  B , KONSTAN  J  A , RINDL  J. E  - Commerce
Recommendation  Applications  & J  ]. Date  Mining  & Knowl ­
edge  Discover ,2001,5(1/2) : 115 - 153.
&8 ] WANG  Y , LIM  E  P , HWANG  S  Y. Efficient  Mining  of
Geup  Patterns  Fem  Us  Movement  Date  & J  ]. Date  &
Knowledge  Engineering ,2006,57(3) :240 - 282.
&9'吴雅琴,王晓东.大数据挖掘中的混合差分进化k  -
means 无监督聚类算法&J ] •重庆理工大学学报(自然科
学版),2019,33 (5) : 107 -112.
& 10] AGRAWAL  R,IMINLINSKI  T ,SWAMI  A. Databa  Min ­
ing  :A  PeCormancc  Perspective  & J  ]. INEE  Transactions  on
Knowledge  & Date  Engineering ,2002 ,5 ( 6) :914 - 925.
& 11]凌燕• Hadoop
ApAoa 算法实现策略&J ] •信息
与电脑( 版),2018,417(23) :53 -54.
&12]王蒙,邹书蓉,方睿.一种基于矩阵的Apriori 改进算法
& J ] •信息技术,2018(3) :150 - 154.
& 13 ]吕顺利,杨济海,邓伟,等.Apriori  - AHP 算法在电力通
信网业务风险评估中
及应用&J ] •计算机与数
字工程,2018,46(4) :667 -671.
& 14 '韩博闻.基于ApAori 关联算法的配电网运行大数据关联
分析模型&J ] •上海电力学院学报,2018,34(2):67-72.
Rearcc  on  E  - Commercc  Personalized  Recommeedation  System
Bad  on  Apriori  Data  Mining
TAO  Qingfeng
(Practice  Teachiny  Center  of  Minnan  Instituto  of  Technology , Shshi  Fujian  362700 , China)
Abstract : The  automatic  personalized  recommendation  system  bad  on  Apriori  alyorithm  is  studied  in  this  paper.
The  system  con  mine  the  big  data  of  daily  transaction  behavior  of  c  - commerce  to  help  ur  lect  customized  rec ­ommendation  contenh  The  alyorithm  focus  on  the  process  of  173X0^00 association  rules  in  a  f T gc  repositoro  and
converts  the  association  rules  into  recommendations  for  dpfeeni  ur  preferences  bad  on  improved  Apriori  tech ­
nology. On  this  basis , weights  arc  cited  to  optimize  pruniny  of  the  alyorithm  to  reduce  complexity  and  further  impevo  the  real  - hmc  performance  of  the  alyorithm.
Key  words : personalization  ; Apriori  alyorithm  ; date  mininy  ; c  - commerce  system
・64

本文发布于:2023-06-16 07:02:54,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1040750.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   推荐   用户   项集   系统   数据
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图