如何解决刮桌,无桌类
我试图从https://fxtop.com/en/historical-exchange-rates.php?A=1&C1=USD&C2=IDR&MA=1&DD1=&MM1=08&YYYY1=1995&B=1&P=&I=1&DD2=23&MM2=07&YYYY2=2020&btnOK=Go%21抓取表格,但由于无法找到表类而无法抓取数据,有人可以帮助正确进行加密吗?预先谢谢你。
import pandas as pd
import requests
from bs4 import BeautifulSoup
url = "https://fxtop.com/en/historical-exchange-rates.php?A=1&C1=USD&C2=IDR&MA=1&DD1=&MM1=08&YYYY1=1995&B=1&P=&I=1&DD2=23&MM2=07&YYYY2=2020&btnOK=Go%21"
r = requests.get(url)
html = r.text
soup = BeautifulSoup(html)
table = soup.find('table',border = 1)
print(table)
result = pd.DataFrame(data,columns=['month','average USD/idr=','Min USD/IDR=','Max USD/IDR=','Nb of working days'])
result.to_csv("usd_.csv",index=False)
df = pd.read_csv("usd_.csv")
pd.set_option('display.max_rows',df.shape[0]+1)
print(df)
解决方法
您可以按类型和任何属性查找元素:
table = soup.find('table',{"border": "1"})
,
import pandas as pd
df = pd.read_html(
"https://fxtop.com/en/historical-exchange-rates.php?A=1&C1=USD&C2=IDR&MA=1&DD1=&MM1=08&YYYY1=1995&B=1&P=&I=1&DD2=23&MM2=07&YYYY2=2020&btnOK=Go%21",header=0)[-3]
print(df)
df.to_csv("data.csv",index=False)
输出:check online
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。