如何解决是否有计算 R 中向量之间平均差的函数?
我发现 some great code 可以从较大的项目池中找到 n 个项目子集,从而最大化子集之间的重叠分布。
我正在粘贴下面的一些代码。据我了解,这会尝试 100 次不同的迭代,每次从候选列表中随机抽取 40 个项目子集。然后计算每 40 个项目在某个变量上的分布重叠,在本例中为 LgSUBTLWF
。稍后将继续查找哪个迭代使这种重叠最大化。
seed_results <- map_df(1:100,function(seed_i) {
# get the sample of 40 words of each kind
set.seed(seed_i)
sample_i <- d_no0 %>%
group_by(Matching.Type) %>%
slice_sample(n = 40)
# get the group overlaps on frequency
m_frq <- overlap(list(
filter(sample_i,Matching.Type=="1") %>% pull(LgSUBTLWF),filter(sample_i,Matching.Type=="3") %>% pull(LgSUBTLWF),Matching.Type=="4") %>% pull(LgSUBTLWF)
)) %>%
with(OV)
我的问题是,如果我想计算每个 40 个项目子集的均值的相似程度怎么办。例如,每个配对比较的平均 T 值。我的目标是尝试将其最小化,而不是最大化重叠分布。
我到底要怎么做(即提取平均 T 值然后取平均值)?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。