微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用python比较两个网页的最简单方法是什么?

您好我想使用python脚本比较两个网页.
我怎么能实现它?提前致谢!

解决方法:

首先,您要检索两个网页.你可以使用wget,urlretrieve等:
wget Vs urlretrieve of python

其次,你想“比较”页面. Chinmay指出,您可以使用“差异”工具.您还可以对这两个页面进行关键字分析:

>解析页面中的所有关键字.例如How do I extract keywords used in text?
>可选择使用以下内容的词语“词干”:
http://pypi.python.org/pypi/stemming/1.0
>使用一些数学来比较两个页面的关键字,例如术语频率 – 逆文档频率:http://en.wikipedia.org/wiki/Tf%E2%80%93idf,其中有一些python工具,如:http://wiki.python.org/moin/InformationRetrieval

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐