清风化煞_-优快云博客

原创 python爬虫——用Scrapy框架爬取阳光电影的所有电影

python爬虫——用Scrapy框架爬取阳光电影的所有电影1.附上效果图2.阳光电影网址http://www.ygdy8.net/index.html3.先写好开始的网址 name = 'ygdy8' allowed_domains = ['ygdy8.net'] start_urls = ['http://www.ygdy8.net/index.html']4....

2019-06-04 19:22:37 3054

原创 python数据分析——用jieba和词云做知乎的数据分析

python数据分析——用jieba和词云做知乎的数据分析1.附上效果图2.我先用爬虫爬取了知乎2019年知乎问题和描述（我之前写过的爬虫https://blog.youkuaiyun.com/weixin_45019310/article/details/89923644），再进行数据分析3.先用jieba进行分词mytext = open(r'D:\pycharm\python项目\知乎\zh...

2019-05-26 12:47:23 2943 1

原创 python爬虫——用selenium爬取淘宝商品信息

python爬虫——用selenium爬取淘宝商品信息1.附上效果图2.淘宝网址https://www.taobao.com/3.先写好头部browser = webdriver.Chrome()wait = WebDriverWait(browser,20)#设置等待时间为20秒url ='https://www.taobao.com/'keyword = 'python爬虫'...

2019-05-26 10:31:51 9817 7

原创 python爬虫——用selenium爬取京东商品信息

python爬虫——用selenium爬取京东商品信息1.先附上效果图（我偷懒只爬了4页）2.京东的网址https://www.jd.com/3.我这里是不加载图片，加快爬取速度，也可以用Headless无弹窗模式options = webdriver.ChromeOptions()options.add_experimental_option('prefs', {'profile....

2019-05-10 09:32:37 7377 2

原创 python爬虫——关于ajax加载之爬取2019年知乎问题和描述

python爬虫——关于ajax加载之爬取2019年知乎问题和描述1.先放上效果图(描述为空的原因是本来就没写描述或者只放了图片被我去掉了).2.知乎网址https://www.zhihu.com/3.先写好请求头(知乎是需要登录才能看的，所以一定要写cookie，而且要过几天cookie就会过期，一定要记得更新，老夫就是栽在这上面耽误了好久)#请求头headers = { ...

2019-05-07 16:23:23 1874 1

原创 python爬虫——多线程的简单实例

python爬虫——多线程的简单实例1.先附上没有用多线程的包图网爬虫的代码import requestsfrom lxml import etreeimport osimport timestart_time = time.time()#记录开始时间for i in range(1,4): #1.请求包图网拿到整体数据 response = requests.ge...

2019-05-07 14:25:17 2750 1

原创 python爬虫——用xpath做一个简单爬虫

Python爬虫——用xpath做一个简单爬虫1.效果图.2.网页传送门.3.进入网页后按F12打开开发者工具，用鼠标样的按钮定位到指定位置4.上图中有所有我们要的数据，标题（大气震撼党政党建图文片头AE模板）和视频链接( //video-qn.ibaotu.com/18/06/49/508888piCHsa.mp4_10s.mp4) ，就开始写代码了，首先先导入包import re...

2019-05-06 11:41:05 1273

心之所向的博客