如何解决您是否必须从多元正态模拟聚类数据?
我已经阅读了许多帖子(例如 this one 和 this one),其中作者模拟了集群数据(一些代理 $n$ 跨集群 $c$ 分配,错误在集群但不是集群之间)由sampling from a multivariate normal distribution。
但后来我看到像 this one 这样的帖子,其中作者指定了一个 ICC 并通过从单变量法线中绘制来创建聚类数据。 fabricatr package simulates clustered data也是如此。
因此,即使聚类数据被正式定义为从多元分布中抽取,是否真的有必要从多变量中模拟抽取,或者您可以仅从单变量中进行模拟,如下所示:
n = 1000
c = 50
df = data.frame(
agent = 1:n,cluster = rep(1:c,each = n/c)
)
df$x = df$u_i = rnorm(n = n,mean = 0,sd = 1)
df$u_c = rep(rnorm(c,sd = 10),each = n/c)
df$y = 1 + 5*(df$x + df$u_c) + (df$u_c + df$u_i)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。