网络编程概念全面接触(一)
草木瓜整理 2006-8-1
前言
从最基本的概念层层入手,才能全面了解网络的本质性。
1.计算机网络
将地理位置不同、并具有独立功能的多个计算机系统通过通信设备和线路连接起来,以
功能完善的网络软件实现网络中资源共享的系统,称为计算机网络。计算机网络是通信技术
与计算机技术相结合的产物。
2.因特网(Internet)
因特网又称国际互联网,是一个由各种不同类型和规模的独立运行和管理的计算机网络
组成的世界范围的计算机网络。是一个全球的、开放的信息资源网。因特网只是一个极为庞大
而又复杂的计算机网络。
因特网有三个基本要素:TCP/IP(传输控制协议/网际协议),DN(域名)和IP地址,URL(统
一资源定位器)。
3.网络协议
网络协议即网络中(包括互联网)传递、管理信息的一些规范。如同人与人之间相互交流
是需要遵循一定的规矩一样,计算机之间的相互通信需要共同遵守一定的规则,这些规则就称
为网络协议。是计算机通过网络彼此交流的一种“语言”。不同计算机之间必须使用相同的网络
协议才能进行通信。网络上的计算机要互相通信,必须遵循一定的协议。常见的网络协议有
TCP/IP,IPX/SPX和NETBEUI。目前使用最广泛的网络协议是Internet的TCP/IP协议。
4.IP地址
IP是Internet Protocol的缩写,即互联网协议。为了能在网络上准确地找到一台计算机,
TCP/IP协议为每个连到Internet上的计算机分配了一个惟一的用32位二进制数字表示的地址的
字,就是我们常说的IP地址。Internet上的每台主机(Host)都有一个唯一的IP地址,这是
Internet能够运行的基础。
Internet依靠TCP/IP协议,在全球范围内实现不同硬件结构、不同操作系统、不同网络系统
的互联。在Internet上,每一个节点都依靠唯一的IP地址互相区分和相互联系。
5.域名(DN)
域名的英文为Domain Name,便于记忆的IP地址别号,也相当于一个企业或机构在互联网
上主机的一个代号。域名的形式是以若干个英文字母和数字组成,由“.”分隔成几份。如:
www.sohu.com.cn
6.URL(统一资源定位器)
URL是Uniform Resource Locator的缩写,即统一资源定位系统,也就是我们通常所说的
网址。URL是在Internet的WWW服务程序上用于指定信息位置的表示方法,它指定了如HTTP或FTP
等Internet协议,是惟一能够识别Internet上具体的计算机、目录或文件位置的命名约定。
例如,某一论坛的网址,也就是URL为:http://www.test.com/bbs
7.网络编程
网络编程的目的就是指直接或间接地通过网络协议与其他计算机进行通讯。网络编程中
有两个主要的问题,一个是如何准确的定位网络上一台或多台主机,另一个就是找到主机后
如何可靠高效的进行数据传输。在TCP/IP协议中IP层主要负责网络主机的定位,数据传输的
路由,由IP地址可以唯一地确定Internet上的一台主机。而TCP层则提供面向应用的可靠的
或非可靠的数据传输机制,这是网络编程的主要对象,一般不需要关心IP层是如何处理数据
的。
目前较为流行的网络编程模型是客户机/服务器(C/S)结构。即通信双方一方作为服务
器等待客户提出请求并予以响应。客户则在需要服务时向服务器提出申请。服务器一般作为
守护进程始终运行,监听网络端口,一旦有客户请求,就会启动一个服务进程来响应该客
户,同时自己继续监听服务端口,使后来的客户也能及时得到服务。
在Internet上IP地址和主机名是一一对应的,通过域名解析可以由主机名得到机器的IP,
由于机器名更接近自然语言,容易记忆,所以使用比IP地址广泛,但是对机器而言只有IP地
址才是有效的标识符。
通常一台主机上总是有很多个进程需要网络资源进行网络通讯。网络通讯的对象准确的讲
不是主机,而应该是主机中运行的进程。这时候光有主机名或IP地址来标识这么多个进程显然
是不够的。端口号就是为了在一台主机上提供更多的网络资源而采取得一种手段,也是TCP层
提供的一种机制。只有通过主机名或IP地址和端口号的组合才能唯一的确定网络通讯中的对象:
进程。
8.套接字
所谓socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄。应用程
序通常通过"套接字"向网络发出请求或者应答网络请求。
套接字可以根据通信性质分类,这种性质对于用户是可见的。应用程序一般仅在同一类的
套接字间进行通信。不过只要底层的通信协议允许,不同类型的套接字间也照样可以通信。套
接字有两种不同的类型:流套接字和数据报套接字。
下面的解释比较抽象,不看也罢。
套接字是通信的基石,是支持TCP/IP协议的网络通信的基本操作单元。可以将套接字看作
不同主机间的进程进行双向通信的端点,它构成了单个主机内及整个网络间的编程界面。套接
字存在于通信域中,通信域是为了处理一般的线程通过套接字通信而引进的一种抽象概念。套
接字通常和同一个域中的套接字交换数据(数据交换也可能穿越域的界限,但这时一定要执行
某种解释程序)。各种进程使用这个相同的域互相之间用Internet协议簇来进行通信。
9.套接字工作原理
要通过互联网进行通信,你至少需要一对套接字,其中一个运行于客户机端,我们称之为
ClientSocket,另一个运行于服务器端,我们称之为ServerSocket。
根据连接启动的方式以及本地套接字要连接的目标,套接字之间的连接过程可以分为三个
步骤:服务器监听,客户端请求,连接确认。
所谓服务器监听,是服务器端套接字并不定位具体的客户端套接字,而是处于等待连接的
状态,实时监控网络状态。
所谓客户端请求,是指由客户端的套接字提出连接请求,要连接的目标是服务器端的套接
字。为此,客户端的套接字必须首先描述它要连接的服务器的套接字,指出服务器端套接字的
地址和端口号,然后就向服务器端套接字提出连接请求。
所谓连接确认,是指当服务器端套接字监听到或者说接收到客户端套接字的连接请求,它
就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发给客户端,一旦
客户端确认了此描述,连接就建立好了。而服务器端套接字继续处于监听状态,继续接收其他
客户端套接字的连接请求。