微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

测试数据集的正态性

如何解决测试数据集的正态性

我有一列包含 40 个样本的密度数据值,另一列包含样本编号;我想测试密度是否存在差异(p

此外,每当我使用 tapply 函数来测试此数据的正态性时,它都会说:

FUN(X[[i]],...) 中的错误:样本大小必须在 3 到 5000 之间。

我的所有数据值都低于 1,因为它是密度并且我有一种类型的样本(没有不同的类别),那么我将如何测试正态性以及我应该对此类数据进行哪些统计测试?

解决方法

我猜您正在使用 shapiro 测试,这在 R 中不适用于超过 5000 个元素的样本。

正如在这篇文章的评论中所提到的,经过 Stephane 的更正:

library(nortest)
lillie.test(test_vector) 

如果您的样本有重复,并且根据正态性检验的结果,我想是的,ANOVA 或 KW 看起来不错

希望能帮到你

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。