
爬虫
没枕头我咋睡觉
邮箱 pillowsleep@163.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Python】selenium模块基本使用
一、demo示例 效果:运行代码后,自动打开谷歌浏览器,浏览器会首先跳转到百度,然后在搜索框中搜索Python,接着跳转到搜索结果页from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.keys import Keysfrom selenium.webdriver.support import expected_condition...原创 2021-02-01 14:31:55 · 400 阅读 · 1 评论 -
【Python】 requests模块使用
# 定义请求头信息 headers = {"user-agent":"my-app/0.0.1"}# 定义请求参数 params={"key":"value"}# 定义请求cookie cookie = {'key':'value'}定义请求data数据 data = {'key':'value'}# get请求 带参数的g...原创 2020-04-18 20:44:43 · 337 阅读 · 0 评论 -
高匿,普匿与透明代理
高级匿名代理:服务器不会知道你使用了代理。普通匿名代理:服务器知道你使用了代理,但一般无法查出你的IP地址。通明代理:服务器知道你使用了代理,且能查出你的IP地址。...原创 2018-07-27 15:37:13 · 2475 阅读 · 0 评论 -
scrapy框架之request
request是一个类似于http请求的类,对于爬虫而言是一个很重要的类。请求一般是在Spider中创建,在Downloader中执行这样一个请求。同时,在scrapy框架中,还有一个类也可以发送请求,该类是FormRequest ,用于post提交request类的属性和方法url,method,headers,body,meta,copy(),replace()Request参数...原创 2018-08-06 23:07:38 · 468 阅读 · 0 评论 -
Python2之HTMLParse
1 导入库from html.parser import HTMLParser2 运用该模块是一个解析html文件的模块2.1 HTMLParse有如下方法* HTMLParser.feed(数据) 将一些文本提供给解析器。只要它由完整的元素组成,它就被处理; 不完整的数据被缓冲,直到输入或close()调用更多数据 。 数据可以是unicode或 str...原创 2018-10-08 21:14:09 · 1465 阅读 · 0 评论 -
套接字的定义与使用
套接字: 是可以实现不同主机进程通信的一种方式套接字使用流程 1、创建一个套接字 2、使用套接字收发数据 3、关闭套接字 python代码演练: 创建udp发送数据套接字import socketdef main(): """ 创建一个套接字 :return: """ # 创建一个...原创 2019-05-26 11:48:53 · 747 阅读 · 0 评论