微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

抓取 BSCScan 代币持有页面

如何解决抓取 BSCScan 代币持有页面

我正在尝试从此页面获取数据

https://bscscan.com/tokenholdings?a=0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d

但网站所有者不为此目的提供端点 API。所以我尝试以不同的方式实现它:

-使用 DRYSCRAPE 但图书馆似乎被放弃了;

-使用请求,但数据由javascript动态提供;

-USING REQUESTS HTML 但即使在这种情况下,数据似乎也没有被加载。

我想忽略硒,因为它很慢,但我不知道如何解决这个问题。任何人都有可行的解决方案?我需要的数据是包含钱包代币的表。谢谢你的建议,祝你有个美好的一天。

解决方法

你可以用requests-html来做,例如让我们抓取第一行的符号:

https://localhost:44305/en/Identity/Account/ConfirmEmail?userId=d62d4727-f6ce-493c-bcf3-eb85a50a914f&code=Q2ZESjhKbkE2NU5BVk85S2drRnMvV3VtZXBySVFlTHZrQlNvUU9xbUxrYWQ5NjFDV0NvZGY1eHVCK01SSHVIL3EwMjEwYk8rU1lLaHJ4UHF1VS84RjJQTThBWlY4VHZTcGcrQVpiZU9wWHFyWnlsVkFpSFVUV3lIMGJjaG14aFJKQkgxNjZoQkVNM3ZETnR2WHhoZmx0ZnhQR095azdDREJVZVdJN01CTTRCcFptejJvSURjNHloZHdxRDl0UCs0eEdic1NMK25wbnFqb0xhdHFoR3M3T3BkTElhbG5TVU9obTJaTFpvc0xUb0RINzM2UmFBTVlrakZWL2VsV0YvUEJSaE1HQT09

输出:

from requests_html import HTMLSession

session = HTMLSession()

url='https://bscscan.com/tokenholdings'
token={'a': '0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d'}

r = session.get(url,params=token)
r.html.render(sleep=2)

binance_row = r.html.find('tbody tr',first=True)
symbol = binance_row.find('td')[2].text

print(symbol)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?