一、面向对象
面向对象编程(Object-oriented Programming,简称 OOP),是一种封装代码的方法。数据和对数据的操作封装在一起组成类,通过类来创建对象,通过对象之间的交互来实现程序的功能。所以,面向对象编程其实就是对 “类” 和 “对象” 的使用。
类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。
对象(object):通过类定义的数据结构的实例,是对类的具体表现;对象包括两个数据成员(类变量和实例变量)和方法。
属性:描述类的静态特征;
类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。
实例变量:在类的声明中,属性是用变量来表示的。这种变量就称为实例变量,是在类声明的内部但是在类的其他成员方法之外声明的。
方法:描述类的动态行为,类中定义的函数。
类方法:通过装饰器@classmethod声明,常通过类调用,一般用于修改类属性的值。
实例方法:使每一个对象都具有的,通过对象调用;
静态方法:通过装饰器@staticmethod声明,常通过类调用
方法重写:如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override),也称为方法的重写。
继承:即一个派生类(derived class)继承基类(base class)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。例如,有这样一个设计:一个Dog类型的对象派生自Animal类,这是模拟"是一个(is-a)"关系(例图,Dog是一个Animal)。
实例化:创建一个类的实例,类的具体对象。
class Student:
#类属性,学生总数
number = 0
#构造函数,创建对象是调用 ;
def __init__(self,name,age):
self.age = age
self.name=name
#每创建一个学生,人数增加一
Student.number = Student.number+1
def study(self):
print(self.name," studying!!")
def stuAge(self):
print(self.age)
#静态方法,处理类属性
@classmethod
def stu_Number(cls):
print('student number is : ',cls.number)
#析构函数,退出销毁对象
def __del__(self):
Student.number = Student.number-1
print('student number is : ', Student.number)
if __name__=='__main__':
stu = Student('lijian',31)
stu.stuAge()
stu.study()
stu.stu_Number()
二、多线程
线程也叫轻量级进程,是操作系统能够进行运算调度的最小单位,它被包涵在进程之中,是进程中的实际运作单位。 线程自己不拥有系统资源,只拥有一点儿在运行中必不可少的资源。
优点:1、使用线程可以把占据长时间的程序中的任务放到后台去处理。2、用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。3、程序的运行速度可能加快。4、在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。
示例代码:Python实现多线程编程要用到 threading 模块中的 Thread 类。语法:
#创建线程
thread(target=func[args=(value1,value2,.....)])
function - 线程函数名。
args - 传递给线程函数的参数,他必须是个tuple元组类型。
#启动线程
start()
import threading
import time
def func1():
for i in range(10):
print('func1 . ')
time.sleep(0.2)
print('\n')
def func2():
for i in range(10):
print('func2 . ')
time.sleep(0.2)
print('\n')
if __name__ == '__main__':
#当脚本跑起来一共有三个线程;主线程(脚本本身)和子线程1/2
thread1 = threading.Thread(target=func1) #子线程1
thread2 = threading.Thread(target=func2) #子线程2
#线程守护,线程随主线程结束而结束;
# thread1.setDaemon()
# thread1.setDaemon()
thread1.start()
thread2.start()
#阻塞线程,主线程在子线程结束后再结束
thread1.join()
thread2.join()
线程守护:让子线程随主线程结束而结束;需要在子线程启动前设置;调用方法 setDaemon(True)
线程阻塞:让主线程在子线程结束后再结束;需要在子线程 启动后设置;调用join() 方法。
线程同步:如果多个线程共同对某个数据修改,则可能出现不可预料的结果,为了保证数据的正确性,需要对多个线程进行同步。使用Thread对象的Lock和Rlock可以实现简单的线程同步,这两个对象都有acquire方法和release方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到acquire和release方法之间。
#创建锁
threadLock = threading.Lock()
# 获得锁,成功获得锁定后返回True
# 可选的timeout参数不填时将一直阻塞直到获得锁定
# 否则超时后将返回False
threadLock.acquire()
#执行语句
print(num)
# 释放锁
threadLock.release()
三、socket编程
Socket可以理解为TCP/IP协议栈提供的对外的操作接口,即应用层通过网络协议进行通信的接口。Socket可以使用不同的网络协议进行端对端的通信;通过TCP或UDP协议传输信息,分为客户端和服务端。python要导入 socket模块。
服务端:
创建socket对象: s = socket.socket(family,type,protocal)
绑定IP和端口: s.bind(ip,port)
设置监听: s.listen()
等待客户端链接:conn,address = s.acceept(); 接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
socket类型 |
描述 |
socket.AF_UNIX |
只能够用于单一的Unix系统进程间通信 |
socket.AF_INET |
服务器之间网络通信,ipv4 |
socket.AF_INET6 |
IPv6 |
socket.SOCK_STREAM |
流式socket , TCP 协议 |
socket.SOCK_DGRAM |
数据报式socket , UDP 协议 |
socket.SOCK_RAW |
原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。 |
socket.SOCK_SEQPACKET |
可靠的连续数据包服务 |
创建TCP Socket: |
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) |
创建UDP Socket: |
s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) |
客户端:
创建socket对象:s = socket.socket()
连接服务器: s.connect(ip,port)
公共方法:
发送消息: send()
接收消息: recv()
注意点:一、TCP发送数据时,已建立好TCP连接,所以不需要指定地址。UDP是面向无连接的,每次发送要指定是发给谁。二、服务端与客户端不能直接发送列表,元组,字典。需要字符串化repr(data)。
socket函数:
socket函数 |
描述 | |
服务端socket函数 | ||
s.bind(address) |
将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址. | |
s.listen(backlog) |
开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。 | |
s.accept() |
接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。 | |
客户端socket函数 | ||
s.connect(address) |
连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 | |
s.connect_ex(adddress) |
功能与connect(address)相同,但是成功返回0,失败返回errno的值。 | |
公共socket函数 | ||
s.recv(bufsize[,flag]) |
接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 | |
s.send(string[,flag]) |
发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 | |
s.sendall(string[,flag]) |
完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 | |
s.recvfrom(bufsize[.flag]) |
接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 | |
s.sendto(string[,flag],address) |
发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 | |
s.close() |
关闭套接字。 | |
s.getpeername() |
返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 | |
s.getsockname() |
返回套接字自己的地址。通常是一个元组(ipaddr,port) | |
s.setsockopt(level,optname,value) |
设置给定套接字选项的值。 | |
s.getsockopt(level,optname[.buflen]) |
返回套接字选项的值。 | |
s.settimeout(timeout) |
设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) | |
s.gettimeout() |
返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 | |
s.fileno() |
返回套接字的文件描述符。 | |
s.setblocking(flag) |
如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 | |
s.makefile() |
创建一个与该套接字相关连的文件 |
服务端代码:
import socket
#1、创建服务端socket对象,IPV4地址,TCP协议;
soc = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
#2、绑定ip和端口(0-65535)
ip = '127.0.0.1'
port=6000
soc.bind((ip,port))
#3、设置监听 ;参数5表示同时监听5个客户端,不传,则没有限制
soc.listen(5)
#4、等待连接,返回客户端对象和客户端地址,
client,addr = soc.accept()
#如果有客户端连接,给客户端发个信息,发动的字符串必须要编码
print('client>>> ',addr,'\n')
client.send('client,你好,我是server!'.encode('utf-8'))
#接收客户端的信息,最多1024字节,打印接收的信息,要解码
msg=client.recv(1024)
print(msg.decode('utf-8'),'\n')
客户端代码:
import socket
#1、创建服务端socket对象,IPV4地址,TCP协议;
soc = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
#2、连接服务端
soc.connect(('127.0.0.1',6000))
#3、与服务端通信,接受服务端消息,最大接收字段1024字节
msg=soc.recv(1024)
print("接收服务端消息: ",msg.decode('utf-8'),'\n')
#4、向服务端发送消息,要编码
soc.send('server你好,我是client'.encode('utf-8'))
四、requests编程
用作模拟客户端向服务端发送http或https请求;需导入模块request。在locust性能测试离不开它,就是用requests把代码伪装成浏览器。
安装requests:pip install requests
导入: import requests
GET 请求:get(url,params,headers,file。。。。)
url:请求地址
params: 请求参数,一般用字典传入
headers:请求头
post请求:
import requests
#要把http带上,请求百度页面;在pytest,就是请求接口,根据返回内容,判断测试用例是否符合预期
url = "http://www.baidu.com"
#header = {'User-Agen': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'}
req = requests.get(url=url)
'''
response = requests.post("http://httpbin.org/post", data=data)
print(response.text)
'''
#req.text 以字符串返回页面源码 req.json():以json格式返回服务端响应;req.content():以直接返回页面源码
print(req.text)
属性 | 功能 | 例子 |
---|---|---|
Response.status_code | 检查请求是否成功 | 200 代表正常,404 代表网页不存在。 |
Response.encoding | 定义编码 | 如果编码不对,网页就会乱码的。 |
Response.content | 把数据转成二进制 | 用于获取图片、音频类的数据。 |
Response.text | 把数据转为字符串 | 用于获取文本、网页原代码类的数据。 |
图片爬虫实战:
import re
import requests
#随便打开个链接,把里面的图片全部爬下来
url='https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_10398072771050110382%22%7D&n_type=-1&p_from=-1'
header = {"User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'}
#返回页面的请求,
req = requests.get(url=url,headers=header)
#获取页面的码
page = req.text
#re.findall 是正则表达式模块,把符合条件的全部找出来;条件用参数传入;把page里 .png 的这部分内容存在imgs里
imgs = re.findall(r'data-original="(.*?)"',page)
print(page,'\n')
for img in imgs:
print(img,'\n')
#下载图片
for i,j in enumerate(imgs):
print(f'下载第{i+1}'张图片!)
with open(f'./imgs/{i+1}.png','wb') as f:
r = requests.get(url=j,headers=header)
# 将r对象的内容以 [二进制数据] 的形式写入文件
f.write(r.content)
else:
print('下载完')
五、os模块
os是operation system(操作系统)缩写;os就是python对操作系统操作接口的封装。os模块提供了多数操作系统的功能接口函数,当os模块被导入后,它会自适应于不同的操作系统平台,根据不同的平台进行相应的操作。
对于自动化测试,用的最多的是 os.system(cmd) 方法,这个方法是直接调用标准C的system() 函数,相当于简单粗暴在终端运行系统命令,但不能获取命令执行后的返回信息。
import os
os.system("ls")
六、装饰器
闭包函数:外函数中声明一个内函数,在内函数中引用了外函数的变量,外函数返回内函数的应用。作用是: 可以读取函数内部的变量,
#外函数
def outter():
#外函数变量
name='lijian'
#内函数
def inner():
#在内函数使用外函数变量
print(name)
#把name返回,返回外函数变量
return name
#在外函数返回内函数的应用,这样外函数的变量在外部当内函数被调用时,也可以被使用
return inner