
python
文章平均质量分 79
NN179
这个作者很懒,什么都没留下…
展开
-
python 爬虫实现前需要注意的地方
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。 参看百度百科 http://note.sdo.com/u/wyatt/n/mbnUS~jpc4spnM00k001a5 最近原创 2012-07-21 17:06:07 · 6726 阅读 · 0 评论 -
百度贴吧爬虫
2011-09-28 一 代码#coding:gb2312 import urllib2,urllib,re,os import sqlite3,cookielib,time ''' 百度爬虫类 @author:FC_LAMP ''' class SpiderBaiDu: #变量 sqlit = None cur = None baseurl =转载 2012-07-21 16:56:17 · 2181 阅读 · 0 评论 -
python网络爬虫
#FileName: toolbox_insight.py from sgmllib import SGMLParser import threading import time import urllib2 import StringIO import gzip import string import os #rewrite SGMLParser for start_a class Baseg转载 2012-07-21 16:53:00 · 613 阅读 · 0 评论