微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用工作线程为 puppeteer 进行多线程处理以实现网络自动化

如何解决如何使用工作线程为 puppeteer 进行多线程处理以实现网络自动化

你好,我正在做一些网络自动化,我想打开 run puppeteer multithreaded 我的意思是打开同一个页面 10 次,我对工作线程的理解是我猜的最佳解决方案?但我不知道如何正确使用它,我会放一个我所做的示例代码

 const { Worker,isMainThread } = require('worker_threads');
    
    const puppeteer = require('puppeteer') ; 
        let scrapt = async()=>{
        
           
               
                        /* -------------------------------------------------------------------------- */
                        /*                             Launching puppeteer                            */
                        /* -------------------------------------------------------------------------- */
            try{                        
              const browser = await puppeteer.launch({headless: true }) ; 
        
            const page = await browser.newPage();
            await page.setUserAgent(
              `Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/73.0.3683.103 Safari/537.36`
            );
            let browser_b = new Date()
              await page.goto('https://www.supremenewyork.com/')
            let browser_e = new Date()
            console.log(browser_e - browser_b)
    }
    catch(e){
        console.log(e)
    }
let ex = [1,2,3,4]
if (isMainThread) {
    // This re-loads the current file inside a Worker instance.asdasd
    new Worker(__filename);
  } else {
    for(let val of ex) {
      scrapt();

    }
  }

这个脚本打开 4 个浏览器,但如果我打开更多 pc 延迟 ALOT 因为我认为它只使用一个线程而不是全部使用它们? 提前谢谢你,为我的愚蠢感到抱歉

解决方法

试过使用集群吗?在我看来,这是 multi_processing 的好方法,并且比 worker_threads 更易于使用,这是来自 HERE

的示例
const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;

if (cluster.isMaster) {
  console.log(`Master ${process.pid} is running`);

  // Fork workers.
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit',(worker,code,signal) => {
    console.log(`worker ${worker.process.pid} died`);
  });
} else {
  // Workers can share any TCP connection
  // In this case it is an HTTP server
  http.createServer((req,res) => {
    res.writeHead(200);
    res.end('hello world\n');
  }).listen(8000);

  console.log(`Worker ${process.pid} started`);
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。