基于类中心与边界自寻优的聚类算法
张文军;王建平;范世平;张柳霞
【期刊名称】《计算机系统应用》
【年(卷),期】2017(026)011
【摘要】随着互联网应用的普及和深入,涌现了许多新的应用场景和数据类型,导致
许多经典的聚类算法不能有效地适应新的发展形势,成为数据挖掘中的棘手问题和
研究热点,为此提出一种新颖的基于类中心与边界自寻优的数据聚类算法.该算法引
入数据点"距离半径"分布矩阵R及其"距离半径累计"分布矩阵ΣR概念表征数据聚
合度,并依据广度优先原则自寻优R与ΣR中皆为最小的数据点作为类中心;同时,提
出"距离半径偏导"分布矩阵R',描述簇类之间的松散度,并采用广度优先原则自寻优
矩阵R'中的突变跃迁增长点,作为簇类之间的分界.通过经典的Aggregation聚类
数据集的仿真实验测试,表明该算法能够有效地对多种形状、大小和不同密度分布
的数据集进行聚类分析,能较好地识别出孤立点和噪声,具有较高的鲁棒性和分析精
度.%WiththedeepdevelopmentandpopularizationofInternet,newdata
typemergeinnewapplicationfieldssothatmanyclassicclustering
algorithmsarenolongereffectivelyadaptedtonewsituations,sodata
orethearticle
proposanovelclusteringalgorithmbadonlf-optimizingthecenters
orithmcontainsthepoints'distance-
radius-distributionmatrix-Randthecumulativeradius-distributionmatrix-
Σapointswiththe
minimumRandΣRastheclasscentersarearchedunderthebreadth-
orithmalsoincludesthepartialderivativematrix-R'ofthe
distance-radiusdistributiontodescribethegradientchangeoftheloo
ingtolf-optimizingand
breadth-first,thetransitionpointofmatrix-R',whichitspartialderivativeis
thebiggestoneinadjacentpoints,isfoundastheclassboundary,inside
mulatingandtestingthe
algorithmbytypicalclusteringdatatsofAggregation,theresultshows
thatthealgorithmcaneffectivelyclusterthedatatswithdifferent
shapes,sizesanddifferentdensities,identifytheisolatedpointsandnois,
andalsohavebetterrobustnessandaccuracy.
【总页数】6页(P118-123)
【作者】张文军;王建平;范世平;张柳霞
【作者单位】中华女子学院计算机应用技术研究所,北京100101;天地科技建井研
究院,北京100013;天地科技建井研究院,北京100013;中华女子学院计算机应用技
术研究所,北京100101
【正文语种】中文
【相关文献】
1.基于最优类中心扰动的萤火虫聚类算法[J],赵杰;雷秀娟;吴振强
2.基于聚类边界检测的聚类算法[J],段聪聪;辛杭
3.基于改进相似度与类中心向量的半监督短文本聚类算法[J],李晓红;冉宏艳;龚继
恒;颜丽;马慧芳
4.基于局部中心度量的边界点划分密度聚类算法[J],张梅;陈梅;李明
5.一种基于类中心矫正的层次聚类算法[J],王娴;杨绪兵;周宇;周溜溜
因版权原因,仅展示原文概要,查看原文内容请购买
本文发布于:2022-11-26 09:47:11,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/24332.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |