如何解决Rvest'ing 在 R
我的目标是从其中一个网站获取天气数据。我(在一些堆栈用户的帮助下,谢谢) 已经创建了包含 1440 个链接的列表的向量,并决定尝试使用“for”循环来迭代它们。 另外,每个页面都有每周的天气,所以我必须获得 7 行数据(每天一个),标记为 num0/num1/num2/num3。
这就是我想出的:
Links <- #here are the 1440 links i need to iterate over
library("rvest")
for (index in seq(from=1,to=length(Links),by=1)) {
link = paste(Links[index])
for (num in 0:7) {
node_date <-paste(".num",num," .date",sep="")
node_conditions<-paste(".num"," .cond span",sep="")
#here I tried to create an 'embeded for loop' to iterate 7 times over varIoUs nodes consisting data
page = read_html(link)
DayOfWeek = page %>% html_nodes(node_date) %>% html_text()
Conditions = page %>% html_nodes(node_conditions) %>% html_text()
}
}
命令'open.connection(x,"rb")'中的错误:HTTP 错误 502
我真的很困惑我现在应该做什么。
还有其他方法可以实现这个目标吗?或者我在这方面犯了一些新手错误?
先谢谢你!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。