
python爬虫
Marshal Zheng
CUHK-SZ PhD student
展开
-
清水河畔论坛二手帖子爬虫
清水河畔论坛二手帖子爬虫 1 # -*- coding:utf-8 -*- 2 ''' 3 清水河畔二手帖子+爬取二手交易帖子 4 ''' 5 import requests 6 import json 7 from bs4 import BeautifulSoup 8 import sys 9 import urllib 10 import re 11...原创 2018-04-01 21:33:00 · 1031 阅读 · 0 评论 -
pic_scrapy_python
pic_scrapy_python 1 # _*_ coding:UTF-8 _*_ 2 import requests,json,time,sys 3 from contextlib import closing 4 class get_photos(object): 5 def __init__(self): 6 self.photos_id = []...原创 2018-03-22 12:56:00 · 139 阅读 · 0 评论 -
scrapy_novel_python
scrapy_novel_python 1 # _*_ coding:UTF _8_ 2 from bs4 import BeautifulSoup 3 import requests,sys 4 class downloader(object): 5 def __init__(self): 6 self.server = 'http://www.biquk...原创 2018-03-22 12:54:00 · 118 阅读 · 0 评论 -
正则理解与总结笔记
正则理解与总结written by Marshal Zheng文章目录正则理解与总结一、正则语法元字符限定词反义词字符族python修饰符二、实例实例1实例2:re.A三、贪婪和懒惰贪婪懒惰实例四、自动捕获五、零宽断言六、findall一、正则语法元字符\b:匹配单词的开始或者结束\d:匹配数字\s:匹配任意不可见字符(空格、换行符、制表符等)\w:匹配任意Unicode字符...原创 2019-08-22 20:00:06 · 363 阅读 · 0 评论