可以使用一些第三方模块来帮助你实现这个目标。例如,你可以使用 request
模块来请求网页内容,然后使用 cheerio
模块来解析网页并提取所需的数据。
下面是一个简单的例子,展示了如何使用这两个模块来实现一个简单的爬虫:
const request = require('request');
const cheerio = require('cheerio');
const url = 'http://example.com';
request(url, (error, response, html) => {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(html);
$('h1').each((i, element) => {
const header = $(element).text();
console.log(header);
});
}
});