
爬虫
mannnn__
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
实现python自定义爬虫框架
import urllib2 from lxml import etree import Queue import ssl import re import threading import json class CrawlThread(threading.Thread): def __init__(self, urlQueue, dataQueue, threadName): ...原创 2018-10-11 16:26:48 · 990 阅读 · 0 评论 -
urllib2爬取小说三寸人间
# -*- coding: UTF-8 -*- import urllib2 import re import ssl import sys if __name__ == "__main__": #代理 proxy = { 'http': 'xxx', 'https': 'xxx' } ssl_context = ssl._...原创 2018-10-10 16:20:57 · 306 阅读 · 0 评论