如何解决如何在文件中的 RPi 上的 javascript 之后获取完整的 html
我有一个 RPi 4,我想通过终端生成一个具有网页的完整呈现 html 的 website.html。
例如,我想这样做是为了在整个页面中搜索字符串或模式等...
我可以使用 wget
或 curl
之类的东西来做到这一点,例如 wget -O website.html https://www.example.com
以上就是我想要的,但是它不支持javascript。
有些网站(如 Google)几乎所有内容都使用 javascript,所以我无法通过这种方式获得最终的 html。
- 我一整天都在寻找可行的解决方案,而且我已经找到了
发现我需要类似无头浏览器的东西。我努力了
像
PhantomJs
之类的东西,但它们不起作用并且不再 维护。 - 我尝试了
Puppeteer
,但我只能抓取屏幕截图。不是HTML。我以为page.content()
有我想要的东西,但我 无法获取/将其写入文件。当我console.log
编辑它时,我也在那里看到了 javascript...如果有人知道怎么做(写一个 使用 Puppeteer 生成带有最终 html 的文件,然后请告诉我。
难道没有像 wget
这样的“简单”解决方案也可以处理 javascript?
难道没有简单的工作流程/说明来实现这样的目标吗?
如果您能告诉我一些可以执行此操作的命令,请告诉我。我发现有些工具非常复杂,而且我并不熟悉所有的编程语言来完成这项工作。
任何帮助将不胜感激。
解决方法
如果您安装了 Node.js 和 Puppeteer,您可以使用这个简单的脚本来获取执行 JavaScript 的 HTML。将其用作:
public function showLoginForm()
{
return view('admin.login');
}
public function login(Request $request)
{
$this->validateLogin($request);
if ($this->attemptLogin($request)) {
return $this->sendLoginResponse($request);
}
return $this->sendFailedLoginResponse($request);
}
出于测试目的,当前目录中的默认 node script.js url pagename
为 url
,默认 'http://example.com/'
为 pagename
。
'page-timestamp.html'
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。