
爬虫
「已注销」
这个作者很懒,什么都没留下…
展开
-
知乎标签详情页爬虫
#!/usr/bin/env python import requests import MySQLdb import re import json import threading import time from bs4 import BeautifulSoup # from lxml import etree # headers = { # 'Accept':'text/html,原创 2017-02-03 15:50:21 · 996 阅读 · 0 评论 -
nodejs 简易爬虫
用nodejs编写爬虫跟其他语言一样,比较简单,比较各个语言标准库都差不多,主要就是抓取页面,然后分析dom节点,获取数据。 requests 经典的请求库,cherrio 像jquery一样解析dom的库。 这里用csdn举例。 var request = require('request'); var promise = require('bluebird'); const cheeri...原创 2018-11-21 23:08:31 · 232 阅读 · 0 评论