如何解决我们如何使用python从网站服务器下载文件book formate
我正在从网站上下载书籍,几乎我的代码运行流畅,但是当我尝试在PC上打开pdf书籍时。 Adobe Acrobat Reader生成的错误,表明该文件类型不受支持。Error Image
这是Book格式的图片,我确定我的代码需要进行修改,因为网站上该书的格式不同于通常的PDF文件。Book Formate
代码:
import requests
from bs4 import BeautifulSoup
url = 'https://global.oup.com/education/support-learning-anywhere/key-resources-online/?region=international&utm_campaign=learninganywhere&utm_source=umbraco&utm_medium=display&utm_content=support_learning_key_resources&utm_team=int#Primary'
response = requests.get(url)
soup = BeautifulSoup(response.content,'html.parser')
table_data = soup.find_all('td')
books_url_list = []
for link in table_data:
books_url = link.find('a')['href']
books_url_list.append(books_url+'.pdf')
book = books_url_list[1]
book_response = requests.get(book)
with open('books.pdf','wb') as f:
f.write(book_response.content)
那么这个问题的目的是我们如何从这种类型的网站上下载书籍?我们如何访问服务器?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。