使用纯服务器端CSS和HTML解析这听起来非常困难 – 您必须重新创建浏览器的渲染引擎才能获得可靠的结果.
根据你的需要,我可以想到沿着这些方向的某种方式:
>使用wget和–page-requisites之类的东西来获取页面和样式表
>然后:
>使用像Selenium这样的工具浏览每个下载的页面,搜索元素名称并输出它们的位置(如果可以在Selenium中使用.我认为它是,但我不确定)
>创建一个注入每个下载页面的jQuery. jQuery搜索名为“sidebar”,“toolbar”等的元素,获取其位置,将结果保存到本地AJAX片段,并继续下一个下载页面.您只需要在浏览器中打开第一页,其余的将自动发生.实现并非易事,但可能.
如果您可以使用.NET之类的客户端应用程序平台,那么构建包含浏览器控件的自定义应用程序可能会更容易,您可以比仅使用jQuery更自由地访问其DOM.
原文地址:https://www.jb51.cc/php/136221.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。