技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

Python学习 Day56 动态网页爬虫 01

时间：2022-09-30分类：Ajax作者：编程之家原文地址

动态网页爬虫

一、相关概念

1.动态网页

在网页不重新加载的情况下，通过Ajax技术动态更新网站真难过的局部数据
如王者荣耀的高清壁纸，在换页的过程当中，URL没有发生改变，但是壁纸动态的更改了

2.Ajax（Asynchronouse JavaScript And XML）

异步JavaScript和XML
前端与服务器进行少量数据交换，Ajax可以使用网页实现异步更新
这意味着可以在不重新加载整个网页的情况下，对网页的某部分进行更新
传统的网页，如果需要更新内容，必须重新加载整个网页页面。因为传统网页在传输数据格式方向时，使用的是XML语法
而现在数据交互时通常使用的是JSON
使用Ajax加载的数据，即使用了JS，将数据渲染到了浏览器中
在右键–>查看网页源代码还是不能看到Ajax加载的数据，只能看到使用这个URL加载的HTML代码

在这里插入图片描述

打卡数据链接得到的数据是JSON数据格式

在这里插入图片描述

二、动态网页爬虫的解决方案

1.直接分析Ajax调用的接口（数据所在URL），然后通过代码请求这个接口
2.使用selenium+Chromediver模拟浏览器行为获取数据

方式	优点	缺点
分析接口	直接请求数据，无需解析；代码量少，性能高	分析接口较复杂，特别是一些通过JS混淆的接口，需要一定的JS知识；容易被监测到是爬虫
selenium	直接模拟浏览器的行为，浏览器能请求到的，使用selenium也能请求到；爬虫更稳定	代码量多，性能低

分析URL时，去掉其中的“jsoncallback=XX”参数即可得到符合要求的JSON数据格式

在这里插入图片描述

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：UnobtrusiveJavaScriptEnabled、Cl 下一篇：【Layui】利用ajax解决where异步请

相关推荐

ajax 上传文件项目下载

IE6是一个非常老旧的网页浏览器，虽然现在很少人再使用它，但是在某些特殊情况下，我们可能还需要使用IE6来访问网页。而在IE6中，我们通常会使用JavaScript来提交表单，来看一下具体操作。

作者：编程之家时间：2023-08-20

PHP中的count()函数是用来计算数组或容器中元素的个数。这个函数十分方便，在编写代码时使用频率也非常高。无论你是要统计数组的长度、统计字符串中字符出现的次数还是统计对象中属性的个数，count()都可以帮助你轻松

作者：编程之家时间：2023-08-20

ajax 不返回值写法

使用 AJAX（Asynchronous JavaScript and XML）技术可以在不刷新整个页面的情况下，向服务器发送请求并接收响应。通常来说，我们使用 AJAX 请求是为了获取后台数据，并将其展示在前端页面上。然而，有时候我们只需要

作者：编程之家时间：2023-08-20

ajax 下载文件 blob

Ajax（Asynchronous JavaScript and XML）是一种用于改进网页用户体验的技术，通过与服务器进行异步通信，实现在网页上局部刷新数据而不必整个页面刷新的功能。在实际开发中，我们经常需要从服务器端下载文件，而传统

作者：编程之家时间：2023-08-20

ajax 下载excel文件流

本文将介绍如何通过AJAX下载Excel文件流。通过AJAX，我们可以在不刷新整个页面的情况下，向服务器发送请求并获取响应数据。在某些场景下，我们需要通过AJAX下载Excel文件流，以便于在前端使用或保存到本地。本文将详

作者：编程之家时间：2023-08-20

ajax .get .post

Ajax是一种用于客户端和服务器之间的异步通信技术。通过Ajax，我们可以在不刷新整个页面的情况下向服务器发送请求并获得响应数据。而在Ajax的基础上，.get和.post是两种常用的请求方法，它们分别用于发送GET和POST请

作者：编程之家时间：2023-08-20

ajax 上传 excel

AJAX（Asynchronous JavaScript and XML）是一种在网页上实现异步数据传输的技术。通过AJAX，网页可以在不刷新整个页面的情况下与服务器进行数据交互，提升用户体验和页面性能。在实际应用中，AJAX广泛用于表单提交、

作者：编程之家时间：2023-08-20

ajax 下拉 360取不到值

在使用Ajax下拉加载数据的过程中，有时候会出现无法取到360度的问题。这个问题可能是由于代码逻辑的问题导致的，也有可能是网络延迟引起的。为了解决这个问题，我们需要对代码进行仔细排查，并且在合适的地方添加适当

作者：编程之家时间：2023-08-20

ajax 与 .post 区别

本文将介绍Ajax和.post之间的区别。Ajax是一种用于在网页上进行异步通信的技术，能够在不刷新整个页面的情况下更新部分页面内容。.post是jQuery中的一个方法，用于向服务器发送POST请求。虽然它们都可以用于发送异步

作者：编程之家时间：2023-08-20

ajax 上传文件目录权限

AJAX（Asynchronous JavaScript and XML）是一种在Web页面上进行异步数据请求和交互的技术。它的出现使得页面在后台与服务器进行数据交互的同时，不需要重新加载整个页面。在网页开发中，常常需要实现文件上传功能，

作者：编程之家时间：2023-08-20

小编推荐

苹果市值2025年有望达4万亿美元