首先要区分TCP与TCP/IP协议族,TCP是一个工作在传输层的用于传递数据的协议,而TCP/IP协议族是一组以TCP和IP协议为核心的协议族(见前文),不能混为一谈。
一、socket
socket
套接字,直译为排插,其是进程间通信的一种方式,网络上的两个进程通过一个双向的通信连接实现数据交换,这个连接的一端就称为一个socket,每个socket都被绑定到一个特定的IP地址和端口,其本质是编程接口(API),且其内部包含了通信协议,本机地址,本地端口。
socket是一个封装好的程序接口,其内部已经对数据传输过程进行了控制,对如UDP/TCP封包与解包、IP封包与解包等较底层的内容都进行了封装,使开发者可以直接通过API选择传输协议,并传输和接收数据内容。
python中的socket模块
python中提供了socket模块,用socket对象来进行通信,其中socket模块的常用方法(另有很多其他方法,详参此文)如下:
socket.socket(family = AF_INET, type = SOCK_STREAM, proto = 0, fileno = None) 创建套接字对象
family参数意为通信方式,socket.AF_UNIX用于单一的Unix系统进程间通信,socket.AF_INET用于 Internet 进程间通信,socket.AF_INET6用于IPV6
type参数意为套接字类型,socket.SOCK_STREAM用于TCP;socket.SOCK_DGRAM用于UDP,socket.SOCK_RAW原始套接字,用于处理非IP协议通信以及可自行构建IP首部;
proto参数意为协议类型,默认时自动选择。
socket.create_connection(address [, timeout [, source_address ] ]):连接到侦听Internet 地址(2元组 )的TCP服务,然后返回套接字对象
socket.socketpair([ family [, type [, proto ] ] ]):使用给定的地址系列,套接字类型和协议编号构建一对连接的套接字对象
socket.fromfd(fd, family, type, roto = 0):复制文件描述符fd(由文件对象的fileno()方法返回的整数 ),并从结果中构建一个套接字对象
创建出来的socket对象可以代表客户端也可以代表服务器,根据使用方法的不同加以区分,socket对象的常用方法(另有很多其他方法,详参此文)如下所示:
服务器段套接字:
s.bind(address) :绑定地址(host,port)到套接字,在AF_INET下,以元组(host,port)的形式表示地址。
s.listen(backlog) :开始TCP监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量,该值至少为1,大部分应用程序设为5即可。
s.accept() :被动接受TCP客户端连接,(阻塞式)等待连接的到来。
客户端套接字:
s.connect(address) :主动初始化TCP服务器连接,一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex(address) :connect()函数的扩展版本,出错时返回出错码,而不是抛出异常。
公共用途的套接字函数:
s.recv() :接收TCP数据,数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。
s.send() :发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。
s.sendall() :完整发送TCP数据,将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
s.recvfrom() :接收UDP数据,与recv()类似,但返回值是(data,address),其中data是包含接收数据的字符串,address是发送数据的套接字地址。
s.sendto() :发送UDP数据,将数据发送到套接字,address是形式为(ipaddr, port)的元组,指定远程地址。返回值是发送的字节数。
s.close() :关闭套接字。
s.getpeername() :返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
s.getsockname() :返回套接字自己的地址。通常是一个元组(ipaddr,port)。
s.setsockopt(level,optname,value) :设置给定套接字选项的值。
s.getsockopt(level,optname[.buflen]) :返回套接字选项的值。
s.settimeout(timeout) :设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())
s.gettimeout() :返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。
s.fileno():返回套接字的文件描述符。
s.setblocking(flag) :如果flag为False,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值),非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。
s.makefile() :创建一个与该套接字相关连的文件。
python中UDP/TCP协议乃至其他传输协议都可以通过socket模块实现,实现方法见后文。
python中的socketserver模块
在python2中为SocketServer,python3中修改为socketserver模块,其用于简化网络客户与服务器的实现,是socket模块的高级封装。