基于RFM模型的客户分群和K-Means聚类分析
韩国电影图片
项⽬描述
作开头的成语数据源是来⾃Kaggle的⼀个跨国数据集,其中包含2010年12⽉12⽇⾄2011年12⽉9⽇期间发⽣的所有在英国注册的⾮商店在线零售业务的交易。该公司主要销售独特的全场礼品,并且⼤部分客户是批发商。分析⽬的是按照RFM模型对客户进⾏分级,以⽤户的实际购买⾏为数据作为基础,进⾏⽤户群体的划分,再基于不同分类信息,分解成不同群体针对运营,从⽽使企业能更有效的获取客户、使客户更加满意、留住客户成为⾼价值客户、避免客户流失。大搜索时尚社区
数据⼀览
数据形状为:542k ⾏x 8列,8个字段分别为发票号,发票⽇期,商品码,商品描述,数量,单价,顾客ID,国家。
数据
分析思路
R(Recency): 表⽰客户最近⼀次购买的时间距离现在有多远
F(Frequency): 表⽰⽤户在定义时间段内购买产品或服务的次数
偏正短语举例M(Monetary): 表⽰⽤户在定义时间段内购买产品或服务的⾦额
难忘的一次经历>惶急的意思按照每个指标取值不同分为⼋类客户,包括重要价值客户、重要发展客户、重要保持客户、重要挽留客户、⼀般价值客户、⼀般发展客户、⼀般保持客户、⼀般挽留客户等⼋类⽤户
数据清洗
南昌陆军学院0.计算每单的总价,添加Amount列。查看整体数据情况,发现描述和顾客ID列有缺失值,顾客ID类型为浮点型不符合业务逻辑
整体的数据信息
送年