1、什么是socket和websocket?
如果我们将一个小区比作一台计算机,一台计算机里面跑了很多程序,怎么区分程序呢,用的是端口,就好像小区用门牌号区分每一户人家一样。手机送到小明家了,怎么进去呢?从大门进啊,怎么找到大门呢?门牌号呀。不就相当于从互联网来的数据找到接收端计算机后再根据端口判断应该给哪一个程序一样吗。小明家的入口就可以用小区地址+门牌号进行唯一表示,那么同样的道理,程序也可以用IP+端口号进行唯一标识。那么这个程序的入口就被称作Socket。
在网络中的两个应用程序(进程)需要全双工相互通信(全双工即双方可同时向对方发送消息),需要用到的就是socket,它能够提供端对端通信,对于程序员来讲,他只需要在某个应用程序的一端(暂且称之为客户端)创建一个socket实例并且提供它所要连接一端(暂且称之为服务端)的IP地址和端口,而另外一端(服务端)创建另一个socket并绑定本地端口进行监听,然后客户端进行连接服务端,服务端接受连接之后双方建立了一个端对端的TCP连接,在该连接上就可以双向通讯了,而且一旦建立这个连接之后,通信双方就没有客户端服务端之分了,提供的就是端对端通信。
websocket是html5下的一个基于tcp的一种新的网络协议,和http协议一样属于应用层协议,协议名为"ws",它借鉴了socket这种思想,为web应用程序客户端和服务端之间(注意是客户端服务端)提供了一种全双工通信机制。WebSocket 解决了一个长期存在的问题:底层的协议( HTTP )是一个请求 / 响应模式的交互序列,如何实时地发布信息。
2、socket的通信原理和机制
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
基于TCP/IP协议下的socket通信
- 首先服务器进程先建立一个socket,用于监听连接请求,并且绑定端口号为8080,阻塞监听客户端的连接请求,
- 这时候客户端也新建一个socket(该socket以后会当做和服务器的通信socket),这个socket不用像服务器那样绑定一个固定的端口号用于监听,但是操作系统会给该socket绑定一个随机的端口,这里假设是4567。此时客户端的socket1还是一个无效的状态,因为还没有连接
- 客户端用刚刚建立的socket和远程服务器进行连接connect,指明服务器的地址和对应的端口号,此时socket的状态也就补齐了,随后客户端进入阻塞模式,进行TCP的三次握手,请求和服务器建立连接
- 服务器和客户端TCP连接建立好后,解除阻塞,并且返回一个新的socket(因为不能占用welcome socket),新的socket就是服务器和客户端的一个连接状态,该socket变为一个有效状态,此时服务器继续进入阻塞状态等待此socket的数据。
- 连接建立好后,客户端也解除阻塞,它的socket1也变为有效状态。然后客户端把需要发送的数据和对应的socket1(输出流里面封装了socket)交给下层传输层,此时的传输层得到了它相应的信息,根据socket就可以从表中查到需要发送的目的ip和端口,继续交给下层直到发送到服务器。
- 服务器的tcp层收到数据包后,查看源ip、目的ip、源端口、目的端口,一一对照自己的socket表,发现2号socket真好对应,且得知2号socket是pid为100的应用进程,所以tcp把数据发送给该进程,服务器的java进程解除阻塞,read客户端发送来的数据。
- 最后如果服务器和客户端某一方没有数据发了,不想建立连接了,就调用close方法,进行TCP的四次挥手,解除连接,使两边对应的socket都变得无效。
3、websocket的通信原理和机制
既然是基于浏览器端的web技术,那么它的通信肯定少不了http,websocket本身虽然也是一种新的应用层协议,但是它也不能够脱离http而单独存在。具体来讲,我们在客户端构建一个websocket实例,并且为它绑定一个需要连接到的服务器地址,当客户端连接服务端的时候,会向服务端发送一个类似下面的http报文:
可以看到,这是一个http get请求报文,注意该报文中有一个upgrade首部,它的作用是告诉服务端需要将通信协议切换到websocket,如果服务端支持websocket协议,那么它就会将自己的通信协议切换到websocket,同时发给客户端类似于以下的一个响应报文头:
返回的状态码为101,表示同意客户端协议转换请求,并将它转换为websocket协议。以上过程都是利用http通信完成的,称之为websocket协议握手(websocket Protocol handshake),进过这握手之后,客户端和服务端就建立了websocket连接,以后的通信走的都是websocket协议了。所以总结为websocket握手需要借助于http协议,建立连接后通信过程使用websocket协议。
4、websocket解决的问题
1.http存在的问题
http是一种无状态协议,每当一次会话完成后,服务端都不知道下一次的客户端是谁,需要每次知道对方是谁,才进行相应的响应,因此本身对于实时通讯就是一种极大的障碍
http协议采用一次请求,一次响应,每次请求和响应就携带有大量的header头,对于实时通讯来说,解析请求头也是需要一定的时间,因此,效率也更低下
最重要的是,需要客户端主动发,服务端被动发,也就是一次请求,一次响应,不能实现主动发送
2、在websocket出现之前,如果想要用http实现实时通讯有哪些问题
long poll(长轮询):客户端发起长轮询,如果服务端的数据没有发生变更,会 hold 住请求,直到服务端的数据发生变化,或者等待一定时间超时才会返回。返回后,客户端又会立即再次发起下一次长轮询。缺点是需要有很高的并发,也就是说同时接待客户的能力。(场地大小)
ajax轮询:让客户端隔个几秒就发送一次请求,询问服务端是否有新信息。缺点是需要服务器有很快的处理速度和资源。(速度)而且还有推送延迟。
3、websocket的改进
一旦WebSocket连接建立后,后续数据都以帧序列的形式传输。在客户端断开WebSocket连接或Server端中断连接前,不需要客户端和服务端重新发起连接请求。且客户端发送和接受消息是在同一个持久连接上发起,实现了“真·长链接”,实时性优势明显。还有就是服务器可以主动的给客户端推送消息,客户端也可以主动向服务端发送消息,实现了双向的平等对话。
5、socket、websocket、http、tcp/ip的关系
所属层面不同
- TCP 是底层通讯协议,本身没有长连接或短连接的区别,定义的是数据传输和连接方式的规范。
- HTTP 是基于 TCP 协议之上的「短连接」应用层协议,定义的是传输数据的内容以及格式的规范。
- Websocket 是基于 TCP 协议之上的「长连接」应用层协议,定义的是传输数据的内容以及格式的规范。
- Socket 可以支持不同的传输层协议(TCP/UDP),当使用TCP协议进行连接时,该Socket连接就是一个TCP连接,Socket是发动机,提供了网络通信的能力。是操作系统内置的一套操作 TCP/IP 协议的网络(套接字)的方法;
关于TCP/IP
和HTTP
协议的关系,网络有一段比较容易理解的介绍:
在传输数据时,可以只使用(传输层)TCP/IP协议,但是那样的话,如果没有应用层,便无法识别数据内容,如果想要使传输的数据有意义,则必须使用到应用层协议,应用层协议有很多,比如HTTP、FTP、TELNET等,也可以自定义应用层协议。WEB使用HTTP协议作应用层协议,以封装HTTP文本信息,然后使用TCP/IP做传输层协议将它发到网络上。