数据挖掘算法——Clo算法
慢慢造句>五蕴盛
党员演讲稿说明奥:菜鸟的⾃我学习,可能有错。
Clo算法原理:
⼀个频繁闭合项⽬集的所有闭合⼦集⼀定是频繁的,⼀个⾮频繁闭合项⽬集的所有闭合超集⼀定是⾮频繁的。
clo算法是对Apriori算法的改进
具体步骤为:
1.先找到候选1项⽬集FCC1 并得到其⽀持度和闭合
2.之后对每个候选闭合进⾏修剪如果其⽀持度不⼩于最⼩⽀持度则加⼊到FC1
3.⾃⾝不断循环下去直到某个r-项⽬集FCCi为空则算法结束。
栗⼦:
(1)计算FCC各个产⽣式的闭合和⽀持度
⾸先得到FCG的产⽣式: FCC的产⽣式为(A)、(B)、(C)、(D).(E)
然后计算闭合集。\例如,计算{A}的闭合。数据库中第项(ABE)包含{A},这时(A)的闭合⾸先得到{ABE};
第四项(ABD}包含{A},所以取{ABD)和{ABE)的交集{AB)作为(A)的闭合:
第五项{AC}包含{A},则取{AB}和{AC)的交集得到{A},作为{A)的团合;
第七项是{AC},交集为{A};第⼋项{ABCE)与{A}的交集是{A};联想是国产品牌吗
第九项{ABC}与{A)的交集是{A)。这时到了最后⼀项,计算完成,得到{A}的闭合是(A)。并同时计算出{A)的⽀持度为6(可通过对出现的A的超集进⾏计数得到)。同样可以得到FCO所有的闭合与⽀持度
(2)进⾏修剪
将⽀持度⼩于最⼩⽀持度的候选闭合项删除,得到FC1 这个例⼦FC1和FCC1是相同的为(A)(B)(C)(D)(E)
(3)利⽤FC1的generator⽣成FCC2
就是FC1的⾃连接。。。得到FCC2⼀AB,AC,AD,AE,BC.BD.BE,CD.CE.DE
修剪(AE)是(E)的闭合(ABE)的⼦集,(BE)是⼦集(E)的闭合(ABE)的⼦集,所以将这⽹在FCC的元素中我们简单地⽤AB来代替上⾯的(AB),这边AE BE,ABE就是!!频繁项⽬集合修剪过去了我是这么理解的
闭合的闭合是本⾝的话⽽且⽀持度不⼩于最⼩⽀持度也就是?表⽰是频繁项⽬集了得此刻FCC2为AB,AC,AD,BC.BD.CD.CE.DE 这边为何AB不我的看法是AB的闭合不是他⾃⼰。。。不⼀定对⾃⼰理解的
(4)计算各产⽣式的闭合和⽀持度
十二星座月份没表现出来的为空集
(5)进⾏修剪
将⽀持度⼩于最⼩⽀持度的候选闭合项删除.得到FC2,这时(AD)和(CE)的⽀持度为1,被删除。FC2 = (AB,AC. BC, BD)。
(6)利⽤FC2的generator⽣成FCC3并进⾏裁剪
FC2连接后得到: {ABC,BCD).其中的(BCD)有⾮频繁⼦集CD).所以将这项删除。剩下为{ABC),得到的候选项FCC3 ={ABC)。嗯这边有问题这边没有ABD 据涛哥说。。。要第⼀个相同才能连接。。。。所以ABAC相同连接成ABC BC和BD相连接成BCD
铁板水晶粉(7) FCC3;不为空,计算各产⽣式的闭合和⽀持度ABC的闭合为{ABC),⽀持度为2。
(8)进⾏修剪
将⽀持度⼩于最⼩⽀持度的候选闭合项删除,得到FC3.对于本例.FCC3 只有⼀项⽀持度为2,保留。
(9)利⽤FC3⽣成FCC4为空,算法结束。将所有不重复的闭合加⼊到FC中得到FC={A,B,ABE,BD,C,AB,AC,BC,ABC}
(10)统计项⽬集元素数
L3= {ABE,ABC} L2={AB,AC,BC,BD} L1={A,B,C}最⼤个数为3
(11)将L3的频繁项分解特普朗
先分解(ABE)的所产集为AB,AE和BE后两项不存在,将它们加⼈到L中,ABC有2-项于集为(AB)、(AC)和(BC),这三项均在L中得到L2 = {AB AC BC AE BE BD}
(12)将L2的频繁项分解
⽅法同上,得L1为(A.B.C,D.E)
使⽤频繁闭团合项⽬集,发现可以提⾼关联规则的效率。
不理解的地⽅有3 待更新等上课问⽼师
牛顿第一定律教案相连的规则必须要头相同才可以也就是说两个相连成3个必须要AB AC A是相同的 ABC ABD相连成四个必须要AB是相同的才可以
~~~~~ 涛哥如是说