Node.js 利用cheerio制作简单的网页爬虫示例

时间：2019-01-04分类：Node.js作者：佚名

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例，分享给大家，具有如下：

1. 目标

完成对网站的标题信息获取
将获取到的信息输出在一个新文件
工具: cheerio，使用npm下载npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本一致
如果熟练使用jQuery，那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题，将获取到的标题列表编号，最终输出到pageTitle.txt文件里

https.get(url,(res) => {
let html = '';
res.on('data',(data) => {
html += data;
});
res.on('end',() => {
getPageTitle(html);
});
}).on('error',() => {
console.log('获取网页信息错误');
});

function getPageTitle(html) {
const $ = cheerio.load(html);
let chapters = $('.news__item-title');
let data = [];
let index = 0;
let fileName = 'pageTitle.txt';
for (let i = 0; i < chapters.length; i++) {
let chapterTitle = $(chapters[i]).find('a').text().trim();
index++;
data.push(\n${index},${chapterTitle});
}
fs.writeFile(fileName,data,'utf8',(err) => {
if (err) {
console.log('fs文件系统创建新文件失败',err);
}
console.log(已成功将获取到的标题放入新文件${fileName}文件中)
})
}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持编程之家。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

cheerio Node 爬虫网页爬虫

相关推荐

基于nodejs的ssh2怎么实现自动化部署

这篇文章主要介绍“基于nodejs的ssh2怎么实现自动化部署”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“基于nodejs...

nodejs怎么实现目录不存在自动创建

本文小编为大家详细介绍“nodejs怎么实现目录不存在自动创建”，内容详细，步骤清晰，细节处理妥当，希望这篇“nodejs怎么实现目录不存在自动创建”文章能帮助大...

如何把nodejs数据传到前端

这篇“如何把nodejs数据传到前端”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这...

nodejs如何实现定时删除文件

本文小编为大家详细介绍“nodejs如何实现定时删除文件”，内容详细，步骤清晰，细节处理妥当，希望这篇“nodejs如何实现定时删除文件”文章能帮助大家解决疑惑...

nodejs安装模块卡住不动怎么解决

这篇文章主要讲解了“nodejs安装模块卡住不动怎么解决”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来...

如何检测nodejs有没有安装成功

今天小编给大家分享一下如何检测nodejs有没有安装成功的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文...

怎么安装Node.js的旧版本

本篇内容主要讲解“怎么安装Node.js的旧版本”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“怎...

node中的Express框架怎么安装使用

这篇“node中的Express框架怎么安装使用”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家...

nodejs如何实现搜索引擎

这篇文章主要介绍“nodejs如何实现搜索引擎”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“nodejs如何实现搜索引擎...

nodejs中间层如何设置

这篇文章主要介绍“nodejs中间层如何设置”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“nodejs中间层如何设置”文...

nodejs多线程怎么实现

这篇文章主要介绍“nodejs多线程怎么实现”，在日常操作中，相信很多人在nodejs多线程怎么实现问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法...

nodejs怎么分布式

这篇文章主要讲解了“nodejs怎么分布式”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“nodejs怎么分布式”...

nodejs字符串怎么转换为数组

本篇内容介绍了“nodejs字符串怎么转换为数组”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情...

nodejs如何运行在php服务器

这篇文章主要介绍了nodejs如何运行在php服务器的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇nodejs如何运行在php服务器文章都...

nodejs单线程如何处理事件

本篇内容主要讲解“nodejs单线程如何处理事件”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“nodejs单线程如何...

nodejs怎么安装ws模块

这篇文章主要介绍“nodejs怎么安装ws模块”，在日常操作中，相信很多人在nodejs怎么安装ws模块问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法...

怎么打包nodejs代码

本篇内容介绍了“怎么打包nodejs代码”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！

nodejs接收到的汉字乱码怎么解决

本文小编为大家详细介绍“nodejs接收到的汉字乱码怎么解决”，内容详细，步骤清晰，细节处理妥当，希望这篇“nodejs接收到的汉字乱码怎么解决”文章能帮助大家解...

nodejs怎么同步删除文件

这篇“nodejs怎么同步删除文件”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇...

nodejs怎么设置淘宝镜像

今天小编给大家分享一下nodejs怎么设置淘宝镜像的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希

分类导航

热门文章

最新文章