如何解决使用 R 和 Google Analytics 数据进行用户分类
根据有关网站页面浏览量和这些页面上发生的事件的数据对用户进行分类的任务。
准备好的数据片段看起来像这样(我没有弄清楚如何以随机顺序填充0和1的矩阵,样本用0或1填充整行):
/zapadnoe-prodvizhenie/SEO-usa/ 10% 100% 25% 50% 75% 90% Call
40 0 1 0 1 0 0 0 0
41 0 1 0 1 1 1 0 1
42 0 1 0 0 0 0 0 0
43 0 1 0 1 1 1 1 0
44 0 1 0 1 1 1 1 0
45 0 1 0 1 0 0 0 0
46 0 1 0 1 1 0 0 0
47 0 1 0 1 1 0 0 0
48 0 1 0 1 1 1 0 0
49 0 1 0 0 0 0 0 0
50 0 NA NA NA NA NA NA NA
51 0 1 0 0 0 0 0 0
52 0 1 0 0 0 0 0 0
53 0 1 0 1 0 0 0 0
54 0 NA NA NA NA NA NA NA
55 0 1 0 1 1 1 1 0
56 0 NA NA NA NA NA NA NA
57 0 1 0 1 1 0 0 0
58 0 1 0 1 0 0 0 0
59 0 1 0 0 0 0 0 0
60 0 1 0 1 1 1 0 0
清除空行和缩放:
df_ex <- na.omit(df_ex)
df_ex <- scale(df_ex)
df_ex <- df_ex[,-(1:3)]
我们应用 K-means 并构建一个图:
library(factoextra)
library(fpc)
library(cluster)
k2 <- kmeans(df_ex,centers = 2,nstart = 25)
fviz_cluster(k2,data = df_ex)
我如何确定我可以信任这些数据和结果? 如何找到将噪声引入数据的变量? 如何显示特定类的特定功能?
На реальных данных мой результат выглядит следующим образом: Cluster plot
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。