微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Rvest'ing 在 R

如何解决Rvest'ing 在 R

我的目标是从其中一个网站获取天气数据。我(在一些堆栈用户的帮助下,谢谢) 已经创建了包含 1440 个链接的列表的向量,并决定尝试使用“for”循环来迭代它们。 另外,每个页面都有每周的天气,所以我必须获得 7 行数据(每天一个),标记为 num0/num1/num2/num3。

这就是我想出的:

Links <- #here are the 1440 links i need to iterate over
library("rvest")
for (index in seq(from=1,to=length(Links),by=1)) {
  link = paste(Links[index])
  for (num in 0:7) {
  node_date <-paste(".num",num," .date",sep="")
  node_conditions<-paste(".num"," .cond span",sep="") 
#here I tried to create an 'embeded for loop' to iterate 7 times over varIoUs nodes consisting data
  page = read_html(link)
  DayOfWeek = page %>% html_nodes(node_date) %>% html_text()
  Conditions = page %>% html_nodes(node_conditions) %>% html_text()

    
}
} 

现在我收到一个错误

命令'open.connection(x,"rb")'中的错误:HTTP 错误 502

我真的很困惑我现在应该做什么。

还有其他方法可以实现这个目标吗?或者我在这方面犯了一些新手错误

先谢谢你!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。