什么是Socket
在计算机通信领域,Socket被翻译为“套接字”,他是计算机之间进行通信的一种约定或者是一种方式。通过Socket这种约定,一台计算机可以接受到其他计算机的数据,也可以向其他计算机发送数据。
Socket的本质
Socket的本质是编程接口(API),对于TCP/IP的封装,TCP/IP也要提供可供程序员做网络开发所用的接口,这就是Socket编程接口。
Socket的作用
Socket的英文原意是“插座”,的意思,通常在计算机编程中称作套接字,可以用来实现不同的虚拟机或不同计算机之间的通信。
Socket的典型应用
1.Socket的应用之一就是Web服务器和浏览器:浏览器获取用户输入的URL地址,向服务器发起请求,服务器分析接收到的URL请求,将对应的网页内容返回个浏览器,浏览器再经过解析和渲染,将文字、图片、视频等元素呈现个用户,
2.QQ或者微信等聊天工具等:本地的QQ或微信程序就是客户端,登录过程就是连接服务器的过程,聊天过程就是Socket的发送和接收消息过程。
Socket介绍
把Socket比作门,门外是邮局,你送信就需要通过门,把信从门送出去到邮局,然后邮局帮你送达目标的门,目的地主人再把门打开,从里面取出邮局送过来的信,
以(打电话)为例分析通信过程
两人之间打电话:
1.需要做好的保障:两人都要有电话,可正常通话的电话就是Socket
可正常通话的电话:电话能用,电话要插有电话线(信号器),电话要有卡
2.发送消息者通过一端的电话拨号等待
3.接收消息者通过一端的电话接听
4.发送消息者和接收消息者之间可以进行通过
5.消息沟通完毕之后由任意一端先挂断!挂断电话断开连接
6.剩余的一端被迫断开连接,至此通信结束
网络传输
OSI七层网络模型
在网络历史的早期,国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)共同出版了开放系统互联的七层参考模型。一台计算机操作系统中的网络过程包括从应用请求(在协议栈的顶部)到网络介质(底部),OSI参考模型把功能分成七个分立的层次。
特点:
1.人们可以很容易的讨论和学习协议的规范细节
2.层间的标准接口方便了工程模块化。
3.创建了一个更好的互连环境。
4.降低了复杂程度,使程序更容易修改,产品开发的速度更快。
5.每层利用紧邻的下层服务,更容易记住这个层的功能。
网络模型
网络编程中的本质是两个设备之间的数据交换,当然,在计算机网络中,设备主要指计算机。数据传递本身没有多大的难度,不就是把一个设备中的数据发送给另一个设备,然后接受另一个设备的反馈的数据。
现在的网络编程基本上都是基于请求/响应的方式的,也就是一个设备发送请求给另一个,然后接受另一个设备的反馈。
在网络编程中,发起连接程序,也就是发送第一次请求的程序,被称为客户端(Client),等待其他程序连接的程序被称作服务器(Server)。客户端程序可以在需要的时候启动,而服务器为了能够时刻响应客户端的连接,则需要一直启动,例如以打电话为例,首先拨号的人类似于客户端,接听电话的人必须保持电话畅通类似于服务器。
连接一旦建立以后,客户端和服务器端就可以进行数据传递了,而且两者的身份是等价的。
在一些查程序中,程序既有客户端功能也有服务端功能,最常见的软件就是BT、eMule这类软件。
IP地址与域名
在现实生活中,如果要打电话就需要知道那人的电话号码,如果要寄信就要知道收信人的地址。在网络中也是这样,需要知道一个设备的位置,则需要使用该设备的IP地址,具体的连接过程由硬件实现,程序员不需过多担心。
IP地址是一个规定,现在使用的是IPv4,即由四个0-255之间的数字组成,在计算机内部存储时只需要4个字节即可。在计算机中,IP地址是分配给网卡的,每个网卡有一个唯一的IP地址,在同一个网络内部,IP地址不能相同,IP地址的概念类似于电话号码或者身份证号的概念。
由于IP地址不方便记忆,所以有专门创造了域名(Domain Name)的概念,其实就是给IP取一个字符的名字,例如163.com、sina.com等。IP和域名之间存在着一定的对应关系,如果把IP地址类比成身份证号,哪域名则是姓名。
而在网络中只能使用IP地址进行数据传输,所以在传输以前,需要把域名转换为IP,这个由称作DNS的服务器专门来完成。
所以在网络编程中,可以使用IP或是域名来标识网络上的任意一台设备。
端口的概念
为了在一台设备上运行多个程序,人为的设计了端口(Port)的概念,类似的例子是公司内部的分机号码。
规定一个设备有216个,也就是65536个端口,每个端口对应一个唯一的程序。每个网络程序,无论是客户端还是服务端,都对应一个或多个特定的端口号。由于0-1024之间多被操作系统占用,所以实际编程时一般采用1024以后的端口号。
使用端口号,可以找到一台设备上唯一的一个程序。所以如果需要和某台计算机建立连接的话,只需要知道IP地址或者域名即可,但是如果想和该台计算机上的某个程序交换数据的话,还必须知道该程序使用的端口号。
Socket/TCP五层网络模型图
TCP和UDP区别
UDP:
1.面向无连接,将数据及源封装在数据包中,不需要建立连接
2.每个数据报的大小限制在64K内
3.因为无连接 是不可靠协议
4.不需要连接连接,速度快
TCP:
1.建立连接,形成传输数据的通道
2.在连接中进行大数据量传输,以字节流的形式
3.通过三次握手(四次挥手)完成连接,是可靠协议
4.必须建立连接,效率会稍低
TCP和UDP协议互不相通!
Socket/TCP
TCP是一种协议
一般需要了解一下几个字段:
-
序号:Seq序号,占32位,用来表示从TCP源端向目的端发送的字节流,发起方发送数据时对此进行标识
-
确认序号:ACK序号,占32位,只有ACK标志位为1时,确认序号字段才有效,ACK=Seq+1
-
标志位共六个:URG、ACK、PSH、RST、SYN、FIN含义:
-
URG:紧急指针
-
ACK:确认序号有效
-
PSH:接收方应该尽快将这个报文交给应用层
-
RST:充值连接
-
SYN:发起一个新连接
-
FIN:释放一个连接
-
-
需要注意的是:
(A)不要将确认序号Ack与标志位中的ACK搞混了。
(B)确认方Ack=发起方Req+1,两端配对
TCP三次握手
所谓三次握手(Three-Way Handshake)即建立TCP连接,就是指建立一个TCP连接时,需要客户端和服务端总共发送3个包以确认连接的建立。在socket编程中,这一过程由客户端执行connect来触发,整个流程如下图所示:
第一次握手:Client将标志位SYN置为1,随机产生一个值seq=J,并将该数据包发送给Server,Client进入SYN_SEND状态,等待Server确认。
第二次握手:Server收到数据包后由标志位SYN=1知道Client请求建立连接,Server将标志位SYN和ACK都置为1,ACK=J+1,随机产生一个seq=K,并将该数据包发送给Client以确认连接请求,Server进入SYN_RECV状态。
第三次握手:Client收到确认后,检查ACK是否为J+1,ACK是否为1,如果正确则将标志位ACK置为1,ACK=K+1,并将数据包发送给Server,Server检查ACK是否为K+1,如果正确则连接建立成功,Client和Server进入ESTABLISHED状态,完成三次握手,随后Client与Server之间就可以开始传输数据了。
SYN攻击:在三次握手过程中,Server发送SYN-ACK后,收到Client的ACK之前的TCP连接称为半连接,此时Serve处于SYN_RECV状态,当收到ACK后,Server转入ESTABLISHED状态。SYN攻击就是Client在短时间内伪造大量不存在的IP地址,并向Server不断的发送SYN包,Server回复确认包,并等待Client的确认,由于源地址不存在,因此Server需要不断重发直至超时,这些伪造的SYN包将长时间占用未连接队列,导致正常的SYN请求因为队列满而被丢弃,从而引起网络阻塞甚至系统瘫痪。SYN攻击就是一种典型的DDOS攻击,检测SYN攻击方式也很简单,即当有大量半连接状态且源地址是随机的,则可以断定遭到SYN攻击了,使用如下命令让其无处可逃:netstat -nap|grep SYN_RECV
四次挥手
由于TCP连接是全双工的,因此每个方向都必须要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的连接,收到一个FIN只是意味着这一方向上没有数据流动了,即不会再收到数据了,但是在这个TCP连接上仍然能够发送数据,直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭。
(1)第一次挥手:Client发送一个FIN,用来关闭Client到Server的数据传输,Client进入FIN_WAIT_1状态。
(2)第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1(与SYN相同,一个FIN占用一个序号),Server进入CLOSE_WAIT状态
(3)第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传输,Server进入LAST_ACK状态
(4)第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手