
爬虫
stloztoeplitz
严格标准不抱怨,宽松要求自提高
展开
-
实战——百度贴吧爬虫
问题来源,因为自己正在学习,而这份代码恰好因为许多的原因而不能够运行,所以我就趁着这个计划将其修正,加深自己对于知识的理解和增值见识。 最初的代码#-*-coding:utf8-*- from lxml import etree from multiprocessing.dummy import Pool as ThreadPool import requests import json impo原创 2016-12-22 20:28:20 · 371 阅读 · 0 评论 -
实战——制作文本爬虫
这个是这个网站http://www.jikexueyuan.com/course/777.html的第一个实战项目,由于网站的提供的代码过于久远,加之python的版本变迁,网页源代码的改变,导致代码bug许多,为了加深我对代码的理解,我就简单的修正了一下,顺便把知识理解的更加深入。参考资料: http://blog.youkuaiyun.com/sinchb/article/details/8351685#原创 2016-12-20 23:24:58 · 275 阅读 · 0 评论