
Python
OFZFZS
没有梦想,何必远方
展开
-
Python3爬虫之爬取百度高清图片
#!/usr/bin/env python # -*- coding:utf-8 -*- # Author: OFZFZS # Datetime:2018/3/23 11:00 # Description: 百度图片爬取 这里只做了简单处理,注意百度图片返回的数据是ajax数据, # 每次返回的是30条,但是我只看到普通图片,高清的图片地址好像加密了,所以我这里只取三十张,没有用Ajax. i...原创 2018-03-23 16:35:54 · 2458 阅读 · 2 评论 -
Python3爬虫lxml的应用之爬取斗图啦表情包
#!usr/bin/env python # -*- coding:utf-8 _*- from urllib import request from lxml import etree class Spider: def __init__(self, page): self.page = page def get_html(self, url): ...原创 2018-03-26 09:46:00 · 815 阅读 · 0 评论 -
Python3.6实现织梦cms post登录与注册,调用pytesseract自动关识别图片验证码
利用python实现DEDECMS的注册和登录,以及识别图片验证码,加入循环可以批量实现登陆和注册,批量网站操作的时候建议伪装协议头或者切换IP.主要开发环境:python3.6PyCharmPIL图片处理库pytesseract dedecms5.6requests模块post登陆#!/usr/bin/env python # -*- coding:utf-8 -*- imp...原创 2018-04-03 19:41:53 · 989 阅读 · 0 评论 -
python爬取内涵吧段子标题和内容
由于内涵段子被封了,换了一个网站www.neihan8.com,利用python爬取内涵吧段子标题和内容,使用python2实现finditer 方法finditer 方法的行为跟 findall 的行为类似,也是搜索整个字符串,获得所有匹配的结果。但它返回一个顺序访问每一个匹配结果(Match 对象)的迭代器。#!/usr/bin/env python # encoding:utf-8 impo...原创 2018-07-11 17:37:57 · 920 阅读 · 0 评论 -
新浪微博、中关村、蘑菇街、微信、国美、苏宁等各大网站登录js解密例子!
例子下载地址:https://github.com/zyc10758/JS-Decryption JS Decryption Test 提供大陆主流网站JS登录加密的解密例子(适合爬虫模拟登录) 本项目示范例子都是经过本人测试通过,部分搜集于网络,网站若更新不保证能用。 目前例子如下: 中关村 逗游 博客园 37游戏 188游戏中心 ...原创 2018-07-21 21:42:00 · 1187 阅读 · 0 评论