如何解决请问如何调试这个CCASS Web Scrapingaspx表单代码?
下面的代码应该从 aspx 网站抓取数据。然而,它没有返回任何东西(也没有错误)。
原始stackoverflow帖子: Scraping .aspx page with python (HKEX)
import requests
from bs4 import BeautifulSoup
URL = "http://www.hkexnews.hk/sdw/search/searchsdw.aspx"
with requests.Session() as s:
s.headers={"User-Agent":"Mozilla/5.0"}
res = s.get(URL)
soup = BeautifulSoup(res.text,"lxml")
payload = {item['name']:item.get('value','') for item in soup.select("input[name]")}
payload['__EVENTTARGET'] = 'btnSearch'
payload['txtStockCode'] = '00001'
req = s.post(URL,data=payload,headers={"User-Agent":"Mozilla/5.0"})
soup_obj = BeautifulSoup(req.text,"lxml")
for items in soup_obj.select("table tbody tr"):
data = [item.get_text(strip=True) for item in items.select("td")]
print(data)
解决方法
你需要改变
http://www.hkexnews.hk/sdw/search/searchsdw.aspx
到
https://www.hkexnews.hk/sdw/search/searchsdw.aspx
他们使用安全协议
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。