微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何根据 R 中的常见用户 ID 创建用于网络分析的边缘列表?

如何解决如何根据 R 中的常见用户 ID 创建用于网络分析的边缘列表?

我正在尝试创建高知名度社交媒体帐户的网络分析,使用感兴趣的帐户作为节点,使用关注者的用户 ID 作为边缘。我一直在与 igraph 合作开展这个项目。

我的节点列表目前是账户的数据框和我创建的每个账户的 ID,如下所示:

nodes <- cbind(c("doug","liz","chris"))
nodes <- as.data.frame(nodes)
nodes <- nodes %>% rowid_to_column("id")

列出的每个帐户都是其自己的数据框,其中有一列 user_id 列出了该帐户的单个关注者。因此,doug$user_id 将是一个包含数千个关注 Doug 的用户的个人 ID 的列表,Liz 和 Chris 也是如此。一个简短的例子:

doug <- structure(list(user_id = c(1732895058,1172265628041908224,377370229,70400631,392951893,1130459322390069248),screen_name = c("DROPPSScience","Lamy40283167","cdockjr","xmtl2","DeleceWrites","evabrooke_26"
)),row.names = c(NA,6L),class = "data.frame")

那么,问题是如何开发对应的边列表。我知道每个边缘的“源”和“目标”将是一对像“doug”和“liz”这样的帐户,但我不确定如何使用来自“big”的每个关注者的原始用户 ID帐户”以显示联系及其强度。

这样做的最终目标是能够说明帐户之间的联系(如果他们有重叠的关注者)以及联系的强度(显示共同的关注者数量)。我知道我必须使用 user_id 列来创建边缘列表,但我不知道如何去做

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。