如何解决从文本中刮取数据
我正在为 Steam 社区市场开发一个价格检查器应用程序。我使用以下代码从网站中提取源代码,其中包括直到今天的所有销售。你能帮我获取数据,它在“[[”和“]]”符号之间吗?
import requests
sites = [
"https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
r = requests.get(url)
page_source = r.text
page_source = page_source.split('\n')
print("\nURL:",url)
for row in page_source[:]:
print(row)
解决方法
我使用正则表达式提取数据
import requests
import re
import json
sites = [
"https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Redline%20%28Field-Tested%29"
]
for url in sites:
r = requests.get(url)
page_source = r.text
# print(page_source)
results = re.search(r'var line1=\[.*\]',page_source).group()
print(results[10:])
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。