微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

jquery – 在javascript加载值后,Nodejs抓取网站

可能是nodejs / jsdom上的新手问题

我试图使用node.js刮一个网站.我正在使用jsdom和jquery获取html并解析所需的东西.但是,不知何故,我得到的价值不是网站上显示的价值.
基本上这些值是由javascript动态更改的,我想要这些值.我使用nodejs / jsdom进行抓取的全部原因是js将被执行并且我在该事件之后得到值.

有没有办法让jsdom等到javascript执行?或者我错了吗?我在这件事上搜索了很多东西.

解决方法

你最好使用像casperjs http://casperjs.org/这样的东西.它是一个基于phantomjs的测试工具.它基本上就像在webkit浏览器中打开页面一样,只是没有GUI.你可以写点像.我不认为它适用于节点,但它应该很容易运行一个casper脚本并将输出管道传回节点:
var casper = require('casper').create({
    loadImages: true,loadplugins: true,verbose: true,//logLevel: 'info',clientScripts: [
        'jquery-1.7.1.min.js',],viewportSize: {
        width: 1366,height: 768,},pageSettings: {
        javascriptEnabled: true,userAgent: 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML,like Gecko) Chrome/19.0.1084.9 Safari/536.5',});

casper.start(url);

casper.thenEvaluate(function () {
    //javascript code to run in the scope of the page
});

原文地址:https://www.jb51.cc/jquery/177543.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐