如何解决比较行中的值并识别重复项
我有一种感觉,这是一个非常简单的方法。我有一个看起来像这样的数据框:
ID Genre1 Genre2
1 Comedy Comedy
2 Drama Drama
3 Sport Sport
4 Drama Comedy
5 Documentary Documentary
6 Entertainment Entertainment
7 Film Film
8 Drama Crime Drama
9 Crime Drama Drama
我想确定哪些行具有相同的值(例如“comedy”和“comedy”)并创建一个名为 match
的新列,将它们标记为“yes”(或“no”,对于那些不匹配)。
根据上面的示例,预期的输出应该是这样的:
ID Genre1 Genre2 Match
1 Comedy Comedy Yes
2 Drama Drama Yes
3 Sport Sport Yes
4 Drama Comedy No
5 Documentary Documentary Yes
6 Entertainment Entertainment Yes
7 Film Film Yes
8 Drama Crime Drama No
9 Crime Drama Drama No
我有什么想法可以去做这件事和/或什么包最好?提前致谢!
解决方法
使用ifelse
:
df$Match <- ifelse(df$Genre1 == df$Genre2,'Yes','No')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。