微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用ddply和R中的权重列计算推土机距离

如何解决使用ddply和R中的权重列计算推土机距离

我有不同国家/地区的163个选举的数据,每个选举都有9行,代表正在竞选的9个主要政党中的每个(以字母A-I索引)。我需要比较这9行中变量 ideolparty 的分布(按投票百分比(变量 pcv )加权)与同一变量(按席位份额加权( 座位数)。我想使用EMD(地球移动距离)进行此比较。

我之前使用ddply和 emdist 软件包计算了数据集中每次选举的EMD。对于上述任务,我发现了一个“肮脏”的解决方案,该解决方案将生成2个不同的数据集,在其中我按照 pcv pcseats 变量告诉我的时间重复每一行,然后我计算了每个国家的EMD。

但是我相信有一种更简洁的方法,只需更少的代码,就可以告知我要比较的每个分布的权重。我找不到,关于R的EMD计算的资料很少(在StackOverflow中,只有带有EMD标签的python问题),并且软件包emdist link本身并没有为我提供解决方案。>

我的数据可以下载here

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。