在计算机的世界中,所有的东西都是用二进制表示的。那么,人类语言要想在计算机中进行表示,就需要通过编码。例如在ASCII编码中字母a被表示为0x61=97(十进制),使用8bit来表示一个字符。而在UTF-8编码的unicode字符集,是可变长度的,最多可以用4B=32bit来表示一个字符,例如一个中文字符。因此如果直接用于网络传输,那么需要传输的数据量是比较大的。
有没有办法减少传输的数据呢?当然,那就是二进制协议。既然直接表示人类的自然语言比较费劲,那么是不是可以直接把自然语言直接编码成二级制呢?例如,在表示Java的访问权限时,把访问权限都改成枚举类型的数值:private 0, default 1, protect 2, public 3. 那么仅仅需要2bit就能完全表示了。而如果按照原文直接翻译到二进制,例如private,一共7个字母,每个字母8bit,则需要7*8=56bit才能表示!这就是二进制协议更加高效的秘密。实际上,我们甚至可以在特定的情况下,直接将一句话编译成一个特定的符号。例如,战争时信号弹,其代表的含义就是:发起进攻/马上撤退。而这个就是使用信号弹的人跟接收信号的人所约定的“通信协议”。