微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 R rvest

如何解决使用 R rvest

作为自学 rvest 的一个例子,我试图抓取一个网站来抓取已经以表格格式编写的数据。唯一的问题是我无法获得底层表数据的输出

我唯一真正需要的是玩家栏。

library(tidyverse)
library(rvest)


base <- "https://www.milb.com/stats/"
base2 <- "?page="
base3 <- "&playerPool=ALL"

html <- read_html(paste0(base,"pacific-coast/","2017",base2,"2",base3))

html2 <- html %>% html_element("#stats-app-root")
html3 <- html2 %>% html_text("#stats-body-table player") 

https://www.milb.com/stats/pacific-coast/2017?page=2&playerPool=ALL(查看实际示例网址的简便方法

“HTML 2”似乎可以工作,但我有点不知道从那里开始做什么。几次不同的尝试都碰壁了。

一旦成功,我将用数字替换文本并执行一些 for 循环(这看起来很简单)。

解决方法

如果您在 chrome 中“检查”页面,您会看到它正在调用下载 json 文件。自己做吧...

JSON.parse()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?