今天要给大家分享的采集代码,主要是使用 puppeteer 库进行编写的,用于采集豆瓣网相关音频。这段代码也是非常的简单实用,一起来看看吧。
// 引入 puppeteer 库
const puppeteer = require('puppeteer');
// 定义获取代理服务器的函数
function getProxy() {
return new Promise((resolve, reject) => {
// 使用 https://www.duoip.cn/get_proxy 获取代理服务器
const url = 'https://www.duoip.cn/get_proxy';
const proxy = require('proxy-agent');
const request = require('request');
const options = {
url: url,
agent: proxy(<