是否有计算 R 中向量之间平均差的函数？

如何解决是否有计算 R 中向量之间平均差的函数？

我发现 some great code 可以从较大的项目池中找到 n 个项目子集，从而最大化子集之间的重叠分布。

我正在粘贴下面的一些代码。据我了解，这会尝试 100 次不同的迭代，每次从候选列表中随机抽取 40 个项目子集。然后计算每 40 个项目在某个变量上的分布重叠，在本例中为 LgSUBTLWF。稍后将继续查找哪个迭代使这种重叠最大化。

seed_results <- map_df(1:100,function(seed_i) {
  # get the sample of 40 words of each kind
  set.seed(seed_i)
  sample_i <- d_no0 %>%
    group_by(Matching.Type) %>%
    slice_sample(n = 40)
  
  # get the group overlaps on frequency
  m_frq <- overlap(list(
    filter(sample_i,Matching.Type=="1") %>% pull(LgSUBTLWF),filter(sample_i,Matching.Type=="3") %>% pull(LgSUBTLWF),Matching.Type=="4") %>% pull(LgSUBTLWF)
  )) %>%
    with(OV)

我的问题是，如果我想计算每个 40 个项目子集的均值的相似程度怎么办。例如，每个配对比较的平均 T 值。我的目标是尝试将其最小化，而不是最大化重叠分布。

我到底要怎么做（即提取平均 T 值然后取平均值）？