技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

Python入门学习:网络刷博器爬虫

时间：2022-11-04分类：Python作者：编程之家

最近两天开始学习Python，由于过去主要使用C，对Python的简洁易用感到很新奇，大大增加了学习的兴趣。

从今天开始记录Python的学习历程和笔记。一方面方便自己未来查阅，另一方面与大家共享学习。

简单浏览了一下Python的简单语法后，我上网找了一些资料。在查找的过程中，看到了一个由智普教育制作的Python学习视频，视频有一段名字叫做”网络刷博器爬虫“吸引了我的注意。

网络刷博器爬虫的基本原理：一些博客网站打开某博客，该博客访问量就加一，如果多次循环打开同一博客，该博客的访问量就会大量上升。

程序需要用到第三方函数库模块：httplib2

函数库的下载地址：https://code.google.com/p/httplib2/

使用前需要配置系统环境变量，在系统环境变量Path后添加python安装目录。进入httplib2模块的解压目录，运行settup.py安装即可

打开一个网页的代码为：

webbrowser.open_new_tab('网址')

有于打开一定数量的网页后，内存会增加，我们需要定时关掉浏览器，关掉浏览器的代码如下（关掉Chrome为例）：

os.system('taskkill/F/IMchrome.exe')

同时要使用到while循环来循环操作，达到刷博客的目的。具体的代码仿照了智普教育学习视频，感谢智普教育，完整的代码如下：

importwebbrowserasweb
importtime
importos
importrandom
count=random.randint(5,7)
j=0
whilej<=count:
i=0
whilei<=8:
web.open_new_tab('网址')#网址自己填入
i=i+1
time.sleep(0.8)
else:
os.system('taskkill/F/IMchrome.exe')
printj,'timewebbrowerclosed'
j=j+1

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：python与shell校验IP地址合法性下一篇：python mkv转mp4,如何将mkv格式转换

相关推荐

空气阻力对乒乓球运动轨迹的影响

在前一篇博客中我们介绍了加侧旋的乒乓球弧圈技术的模拟，本文我们关注的是高吊弧圈和削球弧线这两种轨迹原理，并且引入了空气阻力对乒乓球运动轨迹的影响。通过对空气阻力和马格努斯力的模拟，我们可以看到不同的弧线曲线。对于乒乓球爱好者而言，可以通过这种模拟的结果，来制定比赛中有可能用到的策略，比如低长弧圈球、

作者：DECHIN 时间：2024-09-25

解决python报错：ModuleNotFoundError: No module named '_sysconfigdata_x86_64_conda_linux_gnu'

在近期conda的版本更新中，有可能会删除路径下的_sysconfigdata_x86_64_conda_linux_gnu模块相关备份文件，而在其他的一些软件的运行过程中有可能依赖于这个备份文件，这就会导致运行过程报错模块无法找到的问题。最终我们通过重新复制备份这个文件解决了该问题。

作者：DECHIN 时间：2024-09-25

python3之lambda表达式

本文主要展示了一些lambda表达式的使用示例，通过这些示例，我们可以了解到lambda表达式的常用语法以及使用的场景。在一般情况下，其最大的意义还是简化了python中函数的定义方式，在可读性上远不如def所定义的函数。

作者：DECHIN 时间：2024-09-25

使用jax加速Hamming Distance的计算

本文通过对比Jax和Numpy计算Normalized Hamming Distance的过程来对比了Jax所实现的Numpy的GPU版本所带来的加速效果。实际上在维度比较小的时候，Numpy还是有非常轻量级的优势，此时GPU的加速效果并没有很好的体现出来。但是在规模较大的输入场景下，GPU的并行加

作者：DECHIN 时间：2024-09-25

用CUDA写出比Numpy更快的规约求和函数

我们知道GPU加速在可并行化程度比较高的算法中，能够发挥出比较大的作用，展示出明显的加速效果，而对于一些线程之间存在依赖这样的场景就不一定能够起到很大的加速作用。CUDA官方针对此类问题，提供了atomic的内置函数解决方案，包含有求和、求最大值等常用函数。而这些函数的特点就在于，线程与线程之间需要

作者：DECHIN 时间：2024-09-25

超过Numpy的速度有多难？试试Numba的GPU加速

Numpy这个库在Python编程中非常的常用，不仅在性能上补足了Python语言的一些固有缺陷，还具有无与伦比的强大生态。但是即使都是使用Python，Numpy也未必就达到了性能的巅峰，对于我们自己日常中使用到的一些计算的场景，针对性的使用CUDA的功能来进行GPU的优化，是可以达到比Numpy

作者：DECHIN 时间：2024-09-25

使用autopep8自动规范化python3代码

本文主要通过介绍两个python中常用的编码规范格式化工具：autopep8和black来讲解python编程中一些快速处理编程规范问题的方法，同时也说明了这些软件的局限性。编程规范也是人为制定的，事实上在实际项目中，也不是所有的编程规范都需要满足，这就需要项目的组织者或者领导者有自己的基本判断。结

作者：DECHIN 时间：2024-09-25

乒乓球之弧圈理论

本文通过对马格努斯力的模拟，来理解乒乓球的弧圈原理。并且在这个理论基础之上对比了几种场景下的乒乓球轨迹，比如乒乓球的运动速度，或者日常所说的撞击对乒乓球轨迹的影响。还有乒乓球的角速度，也就是日常我们所说的摩擦对乒乓球轨迹的影响。还有一个在乒乓球界堪称变革的小球改大球对乒乓球这项运动可能带来的影响。由

作者：DECHIN 时间：2024-09-25

在pyqt5中展示pyecharts生成的图像

本文通过一个实际的散点图案例，展示了如何使用pyqt5嵌套一个pyecharts图层的方法，通过这个技巧，可以在pyqt5的框架中也实现精美的数据可视化的功能模块。

作者：DECHIN 时间：2024-09-25

python并行计算之mpi4py的安装与基本使用

在这篇文章中，我们并没有介绍非常多的MPI的应用，其实在普通的并行或者分布式任务中，掌握了各个进程的任务处理过程以及进程间的通信方法就足够了。总体来说，MPI是一个非常通用也非常高效的并行计算软件。有了这些专业的并行化任务调度软件，我们就可以专注于专业任务的代码和算法上，而不需要过多的去关注并行任务

作者：DECHIN 时间：2024-09-25

小编推荐

苹果市值2025年有望达4万亿美元