融入改进的K-means聚类的协同过滤算法的研究与应用

更新时间:2023-07-03 11:40:20 阅读：评论：0

SOFTWARE 2021

软件第42卷第3期

2021年

Vol. 42, No.3

0引言

随着互联网的飞速发展，信息资源呈现几何级数增

长，用户在大量的信息中很难获取到真正需要的数据信息。传统的搜索引擎已无法满足用户的特殊需求，因此个性化推荐系统应运而生，并成为了解决信息过载问题的有效方法。一个完整的个性化推荐系统总体框架包含三个部分：数据特征提取模块、个性化推荐模块、推荐结果模块。个性化推荐系统能够根据用户个人喜好自动

进行信息推荐，减少信息的冗余，简化用户的操作，因此个性化推荐算法也逐渐成为学术界的研究热点之一[1]。

1主要技术

1.1协同过滤算法及其存在的问题innocence翻译

推荐系统中协同过滤推荐算法是当前应用最为广泛，

研究最多，影响最为深远的个性化推荐技术，协同过滤推荐算法的主要思想是：为了更好的服务目标用户，为用户推荐个性化的商品信息，需要获得用户的喜好，即在一个大的数据库中使用相似度计算公式计算搜索目标

用户的N 个最近邻居，根据N 个用户对商品喜好的评

厚脸皮英语基金项目：吉林建筑科技学院2019年校级科研项目“基于聚类的推荐算法及应用研究”（项目编号：校科字[2019]012号）作者简介：刘鑫（1978―），女，黑龙江海伦人，硕士研究生，副教授，研究方向：数据挖掘、大数据分析与处理。

融入改进的K-means 聚类的协同过滤算法的研究与应用

刘鑫

（吉林建筑科技学院，吉林长春 130114）

摘　要：本文通过对K-means 聚类算法和协同过滤推荐算法的学习研究。针对基于用户的协同过滤算法的不足，将改进

的K-means 聚类算法融入其中，设计了基于K-means 聚类算法的个性化推荐算法，并将其应用于旅游景点及线路的个性化推荐中，以提高个性化推荐质量。实验结果表明，基于改进的K-means 聚类的协同过滤算法缓解了初始数据的稀疏性问题，针

对不同用户喜爱的旅游景点及线路推荐，在准确率和召回率两个方面证明可以提高个性化推荐的准确度。

关键词：K-means 聚类；协同过滤算法；最小生成树中图分类号：TP183

文献标识码：A

edesignDOI ：10.3969/j.issn.1003-6970.2021.03.027

本文著录格式：刘鑫.融入改进的K-means聚类的协同过滤算法的研究与应用[J].软件,2021,42(03):097-099

the craftRearch and Application of Collaborative Filtering Algorithm Incorporating

Improved K-means Clustering

LIU Xin

(Jilin Institute of Architecture and Technology, Changchun Jilin 130114)

notnull【Abstract】：This article is bad on the study of K-means clustering algorithm and collaborative filtering

recommendation algorithm. Aiming at the deficiencies of the ur-bad collaborative filtering algorithm, the improved K-means clustering algorithm is incorporated into it, and a personalized recommendation algorithm bad on the K-means clustering algorithm is designed and applied to the personalized recommendation of tourist attractions and routes In order to improve the quality of personalized recommendations. The experimental results show that the collaborative filtering algorithm bad on improved K-means clustering alleviates the sparsity

problem of the initial data. It is proved that it can improve the personalization in terms of accuracy and recall rate for diﬀ erent urs� favorite tourist attractions and routes recommendation. Recommended accuracy.

【Key words】： K-means clustering;collaborative ﬁ ltering algorithm;minimum spanning tree

基金项目论文

软件

第42卷第3期SOFTWARE

分，建立评分矩阵，并预测目标用户所喜好的商品的评分，进行降序排序，将评分最高的前M个商品推荐给目标用户。协同过滤算法的原理图如图1所示。首先进行算法的输入，即数据信息的采集，包括用户的基本信息、商品的基本信息及用户与商品间的关系信息，然后进行协同过滤算法处理，即相似度计算，找到N个最近邻居，最后得到输出结果，即将前M个商品推荐给目标用户。协同过滤算法依据初始评分矩阵，因此存在着数据稀疏性问题，会导致推荐准确性不高[2]。

图1 协同过滤算法的原理图

Fig.1 Schematic diagram of collaborative ﬁ ltering algorithm

1.2 K-means 算法

K-means算法是James MacQueen在1967年提出的，K-means算法是一种基于最近距离划分进行聚类的算法，算法根据目标函数求得最近距离计算相似度，是数据挖掘研究领域中最常用的算法之一。K-means的基本思想是首先在预定的样本集中随机选取K个质心作为初始聚类中心，构成K个簇集，然后计算剩下样本和 K 个初始聚类中心的距离即相似度，将各个样本分别划分给离他最近也就是相似度的值最大的一个簇集中，每次划分后，再根据现有簇集重新计算获得新的聚类中心。不断循环这个过程，直到聚类中心不再变化或者函数满足了收敛条件[3]。

K-means算法进行聚类操作，算法原理简单，易于操作，基于大数据集合进行聚类的运算速度快、效率高。但由于K-means算法中初始的聚类中心是由随机选取方式选定，因此，在聚类过程中初始聚类中心的不确定性会影响推荐结果的准确性。本文提出改进的K-means聚类算法。

glg2 改进的K-means算法

针对K-means算法由于初始聚类中心不确定带来的影响，增加了用户的属性描述，并基于用户属性计算用户相异度的值，作为边的权值建立图结构，应用kruskal 算法计算生成初始聚类中心，将其用于K-means算法中，该算法可以提高初始聚类中心的个数和位置的准确性，提高推荐系统的推荐效率[4]。改进的K-means算法的具体步骤如下：

（1）初始用户信息，对系统中用户基本信息进行预处理，增加用户属性描述（性别、年龄、学历、

查尔斯狄更斯职业、兴趣爱好）使用公式1.1计算用户间的相异度值C（不同用户相同属性的相异值的个数P(u i≠u j)与用户属性总个数P(u i,u j)的比值），规定相异度值越小则用户间的相似度越大。

公式1.1（2）根据公式1.1计算用户相异度值；（3）将用户相异度值C作为边的权值，构造无向加权图G=({V},{E})；

英语作文求职信（4）应用Kruskal算法求出图G的最小生成树T= (U,TE)，步骤如下：

1）初始化：U=V；TE={ }；

2）将边集E按照从小到大进行排序，依次在E集合中寻找最短边（u,v）

3）如果顶点u,v位于T的两个不同的连通分量，则将边（u,v）加入到最小生成树的边集合TE中，顶点u,v 加入到顶点集合U中；

4）循环执行第③步，直到最小生成树T中的连通分量个数为1结束；

图2 改进的K-means算法的流程图Fig.2 Flow chart of the improved K-means algorithm （5）在建立的最小生成树中选择权值最大的N个WeightMax和权值最小的N个WeightMin，求出它们的平均值，在最小生成树中删除大于平均值的边及孤立的顶点，将剩余顶点作为k个用户集合，然后计算得到k个分类的集合中心，即构成了初始的k个聚类中心。（6）执行K-means聚类算法，通过余弦相似度计

刘鑫：融入改进的K-means聚类的协同过滤算法的研究与应用

算公式，完成聚类划分。改进的K-means算法的流程图如图2所示。

3融入改进的K-means聚类的协同过滤算法在旅游景

点及线路个性化推荐系统中的应用

本文将融入改进的K-means聚类的协同过滤算法在旅游景点及线路个性化推荐系统中，通过用户数据及评分矩阵，建立相似用户集，完成旅游景点及线路的个性化推荐[5]。

聚类的协同过滤算法提高了推荐质量，针对不同用户的喜好提高了个性化推荐的准确率。

4总结

本文首先针对K-means聚类算法随机选取初始聚类中心，导致聚类效果不佳的问题，将最小生成树Kruskal 算法应用在K-means聚类算法中，设计了改进的K- means聚类算法，并将其融入到协同过滤算法中，应用于旅游景点及线路个性化推荐系统中，同时在建立系

oceandeep

discount上+线下”共同推进的教育方式，对学生进行及时的、有针对性的“微教育”，从而在推动学生管理工作的同[2] 阮洪妮.信息化时代高职院校学生管理工作的问题研究刍议[J].西部皮革,2020,42(15):103-104.

本文发布于:2023-07-03 11:40:20，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/90/165746.html

上一篇：Web of Science 客户培训手册快速参考指南

下一篇：automated visual inspection

标签：算法用户聚类推荐过滤协同信息个性化

留言与评论（共有 0 条评论）