微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在文件中的 RPi 上的 javascript 之后获取完整的 html

如何解决如何在文件中的 RPi 上的 javascript 之后获取完整的 html

我有一个 RPi 4,我想通过终端生成一个具有网页的完整呈现 html 的 website.html。 例如,我想这样做是为了在整个页面搜索字符串或模式等... 我可以使用 wgetcurl 之类的东西来做到这一点,例如 wget -O website.html https://www.example.com 以上就是我想要的,但是它不支持javascript。

有些网站(如 Google)几乎所有内容都使用 javascript,所以我无法通过这种方式获得最终的 html。

  • 我一整天都在寻找可行的解决方案,而且我已经找到了 发现我需要类似无头浏览器的东西。我努力了 像 PhantomJs 之类的东西,但它们不起作用并且不再 维护。
  • 我尝试了 Puppeteer,但我只能抓取屏幕截图。不是HTML。我以为 page.content() 有我想要的东西,但我 无法获取/将其写入文件。当我console.log编辑它时,我也在那里看到了 javascript...如果有人知道怎么做(写一个 使用 Puppeteer 生成带有最终 html 的文件,然后请告诉我。

难道没有像 wget 这样的“简单”解决方案也可以处理 javascript? 难道没有简单的工作流程/说明来实现这样的目标吗?

如果您能告诉我一些可以执行此操作的命令,请告诉我。我发现有些工具非常复杂,而且我并不熟悉所有的编程语言来完成这项工作。

任何帮助将不胜感激。

解决方法

如果您安装了 Node.js 和 Puppeteer,您可以使用这个简单的脚本来获取执行 JavaScript 的 HTML。将其用作:

public function showLoginForm()
    {
        return view('admin.login');
    }

    public function login(Request $request)
    {
        $this->validateLogin($request);

        if ($this->attemptLogin($request)) {
            return $this->sendLoginResponse($request);
        }

        return $this->sendFailedLoginResponse($request);
    }

出于测试目的,当前目录中的默认 node script.js url pagename url,默认 'http://example.com/'pagename

'page-timestamp.html'

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。