selenium
6点就起床
一个人
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
古诗文网模拟登录(使用tesserocr库进行验证码识别)
from selenium import webdriver from lxml import etree import tesserocr import numpy as np import time from PIL import Image import matplotlib.pylab as plt import matplotlib.image as mpimg #加载谷歌驱动程序 bro=webdriver.Chrome(executable_path='D:\python\Reptiliane原创 2020-12-23 11:55:37 · 460 阅读 · 0 评论 -
基于scrapy框架爬取新浪体育部分板块内容
import scrapy from selenium import webdriver from sohuPro.items import SohuproItem class SohuSpider(scrapy.Spider): name = 'sohu' # allowed_domains = ['www.xxx.com'] start_urls = ['http://sports.sina.com.cn/'] #需求:爬取新浪体育欧冠,西甲,意甲,德甲等5大板块中的新闻原创 2020-12-08 21:35:23 · 479 阅读 · 1 评论
分享