
Python—实例
hunhun1122
每天进步一点点。
展开
-
python爬虫实例项目大全
WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。DouBanSpider [2]- 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet转载 2017-11-02 09:21:42 · 6048 阅读 · 1 评论 -
Python 小说内容抓取
环境 Python27 pycharm2017.2 代码如下:# encoding=utf8import sysreload(sys)sys.setdefaultencoding('utf-8')import urllibimport urllib2from bs4 import BeautifulSoupif __name__ == '__main__':原创 2017-10-21 12:30:11 · 1318 阅读 · 0 评论 -
python 淘宝MM抓取
python 淘宝MM抓取环境:Python27 、win7、pycharm2017.2代码: 代码是复制的别人的,自己调了一下。。。啊哦!1、处理页面标签 tool.py# -*- coding:utf-8 -*-import re# 处理页面标签类class Tool: # 去除img标签,1-7位空格, removeImg = re.c原创 2017-10-21 10:43:24 · 495 阅读 · 0 评论 -
Python 豆瓣影评抓取
Python 豆瓣影评抓取环境:win7 、Python:2.7 、pycharm:2017.2代码如下:# encoding=utf8import urllib2request=urllib2.Request("https://movie.douban.com/nowplaying/hangzhou/")response=urllib2.urlopen(request)原创 2017-10-21 10:28:36 · 1029 阅读 · 0 评论 -
Python 豆瓣pip使用
eg:pip install -i https://pypi.douban.com/simple pandas可以试试这个更新一下你们设置一下默认 pip 源为豆瓣源,速度很快,方法百度或者 google 下原创 2017-10-20 14:29:49 · 1134 阅读 · 0 评论 -
Python-jieba分词
一. Selenium爬取百度百科摘要 简单给出Selenium爬取百度百科5A级景区的代码: 1 # coding=utf-8 2 """ 3 Created on 2015-12-10 @author: Eastmount 4 """ 5 6 import time 7 import re转载 2017-10-20 14:08:37 · 1850 阅读 · 0 评论