微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

是否有计算 R 中向量之间平均差的函数?

如何解决是否有计算 R 中向量之间平均差的函数?

我发现 some great code 可以从较大的项目池中找到 n 个项目子集,从而最大化子集之间的重叠分布。

我正在粘贴下面的一些代码。据我了解,这会尝试 100 次不同的迭代,每次从候选列表中随机抽取 40 个项目子集。然后计算每 40 个项目在某个变量上的分布重叠,在本例中为 LgSUBTLWF。稍后将继续查找哪个迭代使这种重叠最大化。

seed_results <- map_df(1:100,function(seed_i) {
  # get the sample of 40 words of each kind
  set.seed(seed_i)
  sample_i <- d_no0 %>%
    group_by(Matching.Type) %>%
    slice_sample(n = 40)
  
  # get the group overlaps on frequency
  m_frq <- overlap(list(
    filter(sample_i,Matching.Type=="1") %>% pull(LgSUBTLWF),filter(sample_i,Matching.Type=="3") %>% pull(LgSUBTLWF),Matching.Type=="4") %>% pull(LgSUBTLWF)
  )) %>%
    with(OV)

我的问题是,如果我想计算每个 40 个项目子集的均值的相似程度怎么办。例如,每个配对比较的平均 T 值。我的目标是尝试将其最小化,而不是最大化重叠分布。

我到底要怎么做(即提取平均 T 值然后取平均值)?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。