- 博客(8)
- 收藏
- 关注
原创 爬虫必备_正则表达式
什么是正则表达式正则表达式(Regular Expression), 是一个模版字符串, 可以根据这个模版字符串, 对其它字符串进行匹配, 查找, 替换等操作元字符(metacharacter)正则表达式由一个或多个元字符组成常见的元字符:元字符描述[ ]字符类(character class),匹配其中的任意一个字符[a-z]字符a到z的任意一个[^a]不是字符a,^需放在首位*重复前一字符0+次,贪婪匹配(匹配尽可能多的字符)*?重复前一字
2022-02-21 19:37:15
258
原创 爬虫基础_httpx
为什么要使用httpxrequests模块不支持http2.0协议, 在访问使用http2.0协议的网站时, 就需要用到httpx# 使用requests模块访问http2.0的网站, 会报错import requestsurl = 'https://spa16.scrape.center/'headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, lik
2022-02-20 20:46:35
629
原创 爬虫基础_requests库
安装pip install requests基本使用处理GET请求import requestsurl = 'https://www.httpbin.org/get'params = { # GET请求参数 'name': 'germey', 'age': 25}headers = { # 请求头信息 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KH
2022-02-07 10:01:48
687
原创 爬虫基础_urllib
urllib库的结构urllib库包含以下四个模块:request: 基本的HTTP请求模块error: 异常处理模块parse: 工具模块robotparser: 识别robots.txt的模块urlopen方法使用urlopen方法可以发送简单请求APIurllib.request.urlopen(url, data=None, [timeout,] *, cafile=None, capath=None, cadefault=False, context=None)url:
2022-02-06 11:38:24
1580
原创 爬虫前置_HTTP基础
URI, URL 与 URNURI* URI: 全称 Uniform Resource Identifier, 即统一资源标识符, 用来在互联网上唯一的标识某一特定的资源* URI包含两个子集: URL 和 URNURN* URN: 全称 Universal Resource Name, 即统一资源名称, 只描述资源的名称, 而不定位 (很少使用) 例如: urn:isbn:0451450523 指定了一本书的ISBN, 可以唯一标识一本书, 但不能定位这本书的资源URL* URL: 全
2022-01-28 07:55:11
95
翻译 python官方文档翻译_socketserver模块
socketserver – 网络服务器框架socketserver模块简化了编写网络服务器的任务socketserver模块中有四个基本的服务器类:TCPServer 使用TCP协议(Transmission Control Protocol传输控制协议),这个协议提供了在服务器和客户端之间的连续的数据流UDPServer 使用UDP协议(User Datagram Protocol用户数据报协议),这种协议发送的是不连续的信息包,这些信息包到达目的地的顺序可能与发送的顺序不同,在传输过程中,信
2021-05-29 20:01:19
619
原创 橙子的PyQt5学习笔记_连接SQL Server数据库
目前笔记还不够完善,只包含连接部分,后续可能还要补充其它内容"sip, QtGui, QtWidgets 是pyinstaller打包时必要的模块"import sys, sipfrom PyQt5.QtSql import QSqlDatabasefrom PyQt5.QtCore import QCoreApplicationfrom PyQt5 import QtGuifrom PyQt5 import QtWidgets"""创建一个QCoreApplication实例,有了这个实例
2021-04-03 19:08:37
1495
3
原创 橙子的PyQt5学习笔记_PyQt5 GUI程序的基本结构
橙子的PyQt5学习笔记_PyQt5 GUI程序的基本结构Qt GUI程序最好以面向对象的形式来写,面向对象的优势这里就不啰嗦了,还有一个原因是QtDesigner设计的UI文件转成python文件后,也是以类的形式组织的Qt GUI 程序的大致结构像下面这样:import sysfrom PyQt5.QtWidgets import QApplication, QMainWindow, QLabelclass MyWindow(QMainWindow): def __init__(self
2021-03-16 12:02:39
492
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人