微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

R中的集群采样

如何解决R中的集群采样

我想了解这个脚本中发生了什么。为什么在整群抽样中需要均值、标准差?以及 rnorm(200,mean=7,sd=1) 在此 data.frame 上下文中的含义是什么?

#make this example reproducible 
set.seed(1)  

#create data frame
df <- data.frame(tour = rep(1:10,each=20),experience = rnorm(200,sd=1))  

#view first six rows of data frame
head(df)  

#randomly choose 4 tour groups out of the 10
clusters <- sample(unique(df$tour),size=4,replace=F)
  
#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters,]  

#view how many customers came from each tour
table(cluster_sample$tour) 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。