
python爬虫
文章平均质量分 79
梦里的星空
没有
展开
-
python爬虫小程序,爬取百度图片
from selenium import webdriverimport requestsfrom selenium.webdriver import ActionChainsimport timedef get_img(url,finame):#保存图片 # url = 'https://ss2.bdstatic.com/70cFvnSh_Q1YnxGkpoWK1HF6hh...原创 2018-09-08 10:20:01 · 903 阅读 · 0 评论 -
简单带验证码的登陆网站破解
import pytesseractimport requestsfrom selenium import webdriverfrom PIL import Imageimport timedef get_img_url(d,url): """登陆界面的按钮,验证码,写入账号,密码功能的实现,传入参数为浏览器和登陆界面的url""" d.get(url) d...原创 2018-09-11 19:07:28 · 5130 阅读 · 0 评论 -
python基于控制浏览器爬虫
from selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom selenium.webdriver import ActionChainsimport time#创建浏览器对象d = webdriver.Chrome()#可以看到浏览器界面d.implicitly_wait(10...原创 2018-09-07 17:47:50 · 992 阅读 · 0 评论 -
selenium直接用鼠标点击(基于x,y坐标)进行网页爬取
食品生产许可获证企业(SC)的爬取只有名字和编号这个网站是动态加载,并对请求ur进行了加密l所以使用selenium但是,selenium使用不知道为什么一旦进行了对页面数据的操作后,就无法请求到下一页的数据了,所以只能一页一页的请求不停的从第一页跳转,不能使用下一页跳转from selenium import webdriverimport pyautogui as ...原创 2018-10-11 19:40:21 · 19544 阅读 · 1 评论 -
猫眼电影爬取(woff 字体文件解析)
猫眼电影网站,中电影评分在网页显示正常但是检查网页源码会发现,评分所在位置是一串迷之字符串根本认不出,原因是使用了自定义字体代码<span class="stonefont">.</span>使用了自定义的stonefont字体,我们在网页中查找stonefont,很快有了发现,这就是标准的@font-face定义方法。因此我们访问其中woff文件的地址...原创 2018-12-12 16:30:49 · 4353 阅读 · 2 评论