微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

我应该如何管理调查数据中的相关性?

如何解决我应该如何管理调查数据中的相关性?

我对大约 1100 名受访者进行了一项用户调查,目的是更好地了解我的用户以及他们对我们产品的重视程度。我清理了数据并有大约 40 个变量(调查响应)。我正在尝试探索数据并找出人们的偏好与他们对我们服务的满意度之间的相关性。

我创建了一个相关性矩阵,我发现 10 个问题之间存在很强的相关性,其中我询问人们对我们服务的不同属性的满意度(即,评价您对我们设备的满意度,物有所值,包装,交付等)。

我现在想知道这些相关性对我的回归/PCA/聚类分析有什么影响。我总是了解到在运行回归时合并或删除高度相关的变量很重要,但我想避免这种情况,因为这些是我感兴趣的主要变量。

我在下面包含了相关矩阵。蓝色的大方块是我感兴趣的变量集。

Correlation matrix

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。