python高级

Python编程基础与实践：面向对象、多线程、网络通信与请求

原创已于 2022-05-26 12:33:52 修改 · 513 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python

于 2022-05-15 13:56:30 首次发布

python 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了Python的基础编程概念，包括面向对象编程，详细阐述了类、对象、属性和方法。接着讨论了多线程及其优点，展示了如何创建和管理线程。还讲解了socket编程，用于TCP/IP通信，包括服务端和客户端的实现。最后，提到了requests库在HTTP请求中的应用，以及os模块的基本使用。

一、面向对象

面向对象编程（Object-oriented Programming，简称 OOP），是一种封装代码的方法。数据和对数据的操作封装在一起组成类，通过类来创建对象，通过对象之间的交互来实现程序的功能。所以，面向对象编程其实就是对 “类” 和 “对象” 的使用。

类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。
对象（object）：通过类定义的数据结构的实例，是对类的具体表现；对象包括两个数据成员（类变量和实例变量）和方法。

属性：描述类的静态特征；
                类变量：类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。
                实例变量：在类的声明中，属性是用变量来表示的。这种变量就称为实例变量，是在类声明的内部但是在类的其他成员方法之外声明的。
方法：描述类的动态行为，类中定义的函数。
类方法：通过装饰器@classmethod声明，常通过类调用，一般用于修改类属性的值。
实例方法：使每一个对象都具有的，通过对象调用；
静态方法：通过装饰器@staticmethod声明，常通过类调用

方法重写：如果从父类继承的方法不能满足子类的需求，可以对其进行改写，这个过程叫方法的覆盖（override），也称为方法的重写。

继承：即一个派生类（derived class）继承基类（base class）的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。例如，有这样一个设计：一个Dog类型的对象派生自Animal类，这是模拟"是一个（is-a）"关系（例图，Dog是一个Animal）。

实例化：创建一个类的实例，类的具体对象。

class Student:
        #类属性，学生总数
        number = 0
        #构造函数，创建对象是调用 ；
        def __init__(self,name,age):
            self.age = age
            self.name=name
            #每创建一个学生，人数增加一
            Student.number = Student.number+1

        def study(self):
            print(self.name," studying!!")

        def stuAge(self):
            print(self.age)
        #静态方法，处理类属性
        @classmethod
        def stu_Number(cls):
            print('student number is : ',cls.number)

        #析构函数，退出销毁对象
        def __del__(self):
            Student.number = Student.number-1
            print('student number is : ', Student.number)


if __name__=='__main__':
    stu = Student('lijian',31)
    stu.stuAge()
    stu.study()
    stu.stu_Number()

二、多线程

线程也叫轻量级进程，是操作系统能够进行运算调度的最小单位，它被包涵在进程之中，是进程中的实际运作单位。线程自己不拥有系统资源，只拥有一点儿在运行中必不可少的资源。

优点：1、使用线程可以把占据长时间的程序中的任务放到后台去处理。2、用户界面可以更加吸引人，这样比如用户点击了一个按钮去触发某些事件的处理，可以弹出一个进度条来显示处理的进度。3、程序的运行速度可能加快。4、在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。

示例代码：Python实现多线程编程要用到 threading 模块中的 Thread 类。语法：

#创建线程
thread(target=func[args=(value1,value2,.....)])

function - 线程函数名。
args - 传递给线程函数的参数,他必须是个tuple元组类型。


#启动线程
start()

import threading
import time

def func1():
    for i in range(10):
        print('func1 . ')
        time.sleep(0.2)
    print('\n')

def func2():
    for i in range(10):
        print('func2 . ')
        time.sleep(0.2)
    print('\n')


if __name__ == '__main__':
    #当脚本跑起来一共有三个线程；主线程（脚本本身）和子线程1/2
    thread1 = threading.Thread(target=func1) #子线程1
    thread2 = threading.Thread(target=func2) #子线程2

    #线程守护,线程随主线程结束而结束；
#    thread1.setDaemon()
#    thread1.setDaemon()

    thread1.start()
    thread2.start()

    #阻塞线程,主线程在子线程结束后再结束
    thread1.join()
    thread2.join()

线程守护：让子线程随主线程结束而结束；需要在子线程启动前设置；调用方法 setDaemon(True)
线程阻塞：让主线程在子线程结束后再结束；需要在子线程启动后设置；调用join() 方法。

线程同步：如果多个线程共同对某个数据修改，则可能出现不可预料的结果，为了保证数据的正确性，需要对多个线程进行同步。使用Thread对象的Lock和Rlock可以实现简单的线程同步，这两个对象都有acquire方法和release方法，对于那些需要每次只允许一个线程操作的数据，可以将其操作放到acquire和release方法之间。

#创建锁
threadLock = threading.Lock()
# 获得锁，成功获得锁定后返回True
# 可选的timeout参数不填时将一直阻塞直到获得锁定
# 否则超时后将返回False
threadLock.acquire()
#执行语句 
print(num)
# 释放锁
threadLock.release()

三、socket编程

Socket可以理解为TCP/IP协议栈提供的对外的操作接口，即应用层通过网络协议进行通信的接口。Socket可以使用不同的网络协议进行端对端的通信；通过TCP或UDP协议传输信息，分为客户端和服务端。python要导入 socket模块。

服务端：
          创建socket对象： s = socket.socket(family,type,protocal)
          绑定IP和端口： s.bind(ip,port)
          设置监听： s.listen()
        等待客户端链接：conn，address = s.acceept()；接受连接并返回（conn,address）,其中conn是新的套接字对象，可以用来接收和发送数据。address是连接客户端的地址。

socket类型	描述
socket.AF_UNIX	只能够用于单一的Unix系统进程间通信
socket.AF_INET	服务器之间网络通信，ipv4
socket.AF_INET6	IPv6
socket.SOCK_STREAM	流式socket , TCP 协议
socket.SOCK_DGRAM	数据报式socket , UDP 协议
socket.SOCK_RAW	原始套接字，普通的套接字无法处理ICMP、IGMP等网络报文，而SOCK_RAW可以；其次，SOCK_RAW也可以处理特殊的IPv4报文；此外，利用原始套接字，可以通过IP_HDRINCL套接字选项由用户构造IP头。
socket.SOCK_SEQPACKET	可靠的连续数据包服务
创建TCP Socket：	s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
创建UDP Socket：	s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

  客户端：
创建socket对象：s = socket.socket()
连接服务器： s.connect(ip,port)
公共方法：
发送消息：           send()
接收消息： recv()
        注意点：一、TCP发送数据时，已建立好TCP连接，所以不需要指定地址。UDP是面向无连接的，每次发送要指定是发给谁。二、服务端与客户端不能直接发送列表，元组，字典。需要字符串化repr(data)。

socket函数：

socket函数		描述
服务端socket函数
s.bind(address)	将套接字绑定到地址, 在AF_INET下,以元组（host,port）的形式表示地址.
s.listen(backlog)	开始监听TCP传入连接。backlog指定在拒绝连接之前，操作系统可以挂起的最大连接数量。该值至少为1，大部分应用程序设为5就可以了。
s.accept()	接受TCP连接并返回（conn,address）,其中conn是新的套接字对象，可以用来接收和发送数据。address是连接客户端的地址。
客户端socket函数
s.connect(address)	连接到address处的套接字。一般address的格式为元组（hostname,port），如果连接出错，返回socket.error错误。
s.connect_ex(adddress)	功能与connect(address)相同，但是成功返回0，失败返回errno的值。
公共socket函数
s.recv(bufsize[,flag])	接受TCP套接字的数据。数据以字符串形式返回，bufsize指定要接收的最大数据量。flag提供有关消息的其他信息，通常可以忽略。
s.send(string[,flag])	发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量，该数量可能小于string的字节大小。
s.sendall(string[,flag])	完整发送TCP数据。将string中的数据发送到连接的套接字，但在返回之前会尝试发送所有数据。成功返回None，失败则抛出异常。
s.recvfrom(bufsize[.flag])	接受UDP套接字的数据。与recv()类似，但返回值是（data,address）。其中data是包含接收数据的字符串，address是发送数据的套接字地址。
s.sendto(string[,flag],address)	发送UDP数据。将数据发送到套接字，address是形式为（ipaddr，port）的元组，指定远程地址。返回值是发送的字节数。
s.close()	关闭套接字。
s.getpeername()	返回连接套接字的远程地址。返回值通常是元组（ipaddr,port）。
s.getsockname()	返回套接字自己的地址。通常是一个元组(ipaddr,port)
s.setsockopt(level,optname,value)	设置给定套接字选项的值。
s.getsockopt(level,optname[.buflen])	返回套接字选项的值。
s.settimeout(timeout)	设置套接字操作的超时期，timeout是一个浮点数，单位是秒。值为None表示没有超时期。一般，超时期应该在刚创建套接字时设置，因为它们可能用于连接的操作（如connect()）
s.gettimeout()	返回当前超时期的值，单位是秒，如果没有设置超时期，则返回None。
s.fileno()	返回套接字的文件描述符。
s.setblocking(flag)	如果flag为0，则将套接字设为非阻塞模式，否则将套接字设为阻塞模式（默认值）。非阻塞模式下，如果调用recv()没有发现任何数据，或send()调用无法立即发送数据，那么将引起socket.error异常。
s.makefile()	创建一个与该套接字相关连的文件

服务端代码：

import socket

#1、创建服务端socket对象,IPV4地址，TCP协议；
soc = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
#2、绑定ip和端口（0-65535）
ip = '127.0.0.1'
port=6000
soc.bind((ip,port))
#3、设置监听 ；参数5表示同时监听5个客户端，不传，则没有限制
soc.listen(5)
#4、等待连接,返回客户端对象和客户端地址，
client,addr = soc.accept()

#如果有客户端连接，给客户端发个信息,发动的字符串必须要编码
print('client>>> ',addr,'\n')
client.send('client，你好，我是server！'.encode('utf-8'))
#接收客户端的信息，最多1024字节,打印接收的信息，要解码
msg=client.recv(1024)
print(msg.decode('utf-8'),'\n')

客户端代码：

import socket

#1、创建服务端socket对象,IPV4地址，TCP协议；
soc = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

#2、连接服务端
soc.connect(('127.0.0.1',6000))

#3、与服务端通信,接受服务端消息，最大接收字段1024字节
msg=soc.recv(1024)
print("接收服务端消息： ",msg.decode('utf-8'),'\n')

#4、向服务端发送消息,要编码
soc.send('server你好，我是client'.encode('utf-8'))

四、requests编程

用作模拟客户端向服务端发送http或https请求；需导入模块request。在locust性能测试离不开它，就是用requests把代码伪装成浏览器。
安装requests：pip install requests
导入： import requests

GET 请求：get(url,params,headers,file。。。。)
url：请求地址
params：请求参数，一般用字典传入
headers：请求头
post请求：

import requests

#要把http带上，请求百度页面；在pytest，就是请求接口，根据返回内容，判断测试用例是否符合预期
url = "http://www.baidu.com"
#header = {'User-Agen': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'}
req = requests.get(url=url)

'''
response = requests.post("http://httpbin.org/post", data=data)
print(response.text)
'''

#req.text 以字符串返回页面源码 req.json()：以json格式返回服务端响应；req.content()：以直接返回页面源码
print(req.text)

属性	功能	例子
Response.status_code	检查请求是否成功	200 代表正常，404 代表网页不存在。
Response.encoding	定义编码	如果编码不对，网页就会乱码的。
Response.content	把数据转成二进制	用于获取图片、音频类的数据。
Response.text	把数据转为字符串	用于获取文本、网页原代码类的数据。

图片爬虫实战：

import re
import requests

#随便打开个链接，把里面的图片全部爬下来
url='https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_10398072771050110382%22%7D&n_type=-1&p_from=-1'
header = {"User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'}
#返回页面的请求，
req = requests.get(url=url,headers=header)
#获取页面的码
page = req.text
#re.findall 是正则表达式模块，把符合条件的全部找出来；条件用参数传入;把page里 .png 的这部分内容存在imgs里
imgs = re.findall(r'data-original="(.*?)"',page)
print(page,'\n')
for img in imgs:
    print(img,'\n')
#下载图片
for i,j in  enumerate(imgs):
    print(f'下载第{i+1}'张图片！)
    with open(f'./imgs/{i+1}.png','wb') as f:
        r = requests.get(url=j,headers=header)
    # 将r对象的内容以 [二进制数据] 的形式写入文件
        f.write(r.content)
else:
    print('下载完')

五、os模块

os是operation system（操作系统）缩写；os就是python对操作系统操作接口的封装。os模块提供了多数操作系统的功能接口函数，当os模块被导入后，它会自适应于不同的操作系统平台，根据不同的平台进行相应的操作。
对于自动化测试，用的最多的是 os.system(cmd) 方法，这个方法是直接调用标准C的system() 函数，相当于简单粗暴在终端运行系统命令，但不能获取命令执行后的返回信息。

import os
os.system("ls")

六、装饰器

闭包函数：外函数中声明一个内函数，在内函数中引用了外函数的变量，外函数返回内函数的应用。作用是：可以读取函数内部的变量，

#外函数
def outter(): 
    #外函数变量
    name='lijian'
    #内函数
    def inner()：
        #在内函数使用外函数变量
        print(name)
        #把name返回，返回外函数变量
        return name
    #在外函数返回内函数的应用，这样外函数的变量在外部当内函数被调用时，也可以被使用
    return inner