gethostbyname用法
使用这个东西,首先要包含2个头文件:
#include <netdb.h>
#include <sys/socket.h>
struct hostent *gethostbyname(const char *name);
这个函数的传入值是域名或者主机名,例如"www.google.com","wpc"等等。
传出值,是一个hostent的结构(如下)。如果函数调用失败,将返回NULL。
struct hostent {
char *h_name;
char **h_aliases;
int h_addrtype;
int h_length;
char **h_addr_list;
};
解释一下这个结构, 其中:
char *h_name 表示的是主机的规范名。例如www.google.com的规范名其实是www.l.google.com。
char **h_aliases 表示的是主机的别名。www.google.com就是google他自己的别名。有的时候,有的主机可能有好几个别名,这些,其实都是为了易于用户记忆而为自己的网站多取的名字。
int h_addrtype 表示的是主机ip地址的类型,到底是ipv4(AF_INET),还是ipv6(AF_INET6)
int h_length 表示的是主机ip地址的长度
int **h_addr_lisst 表示的是主机的ip地址,注意,这个是以网络字节序存储的。千万不要直接用printf带%s参数来打这个东西,会有问题的哇。所以到真正需要打印出这个IP的话,需要调用inet_ntop()。
const char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt) :
这个函数,是将类型为af的网络地址结构src,转换成主机序的字符串形式,存放在长度为cnt的字符串中。
这个函数,其实就是返回指向dst的一个指针。如果函数调用错误,返回值是NULL。
下面是例程,有详细的注释。
#include <netdb.h>
#include <sys/socket.h>
int main(int argc, char **argv)
{
char *ptr,**pptr;
struct hostent *hptr;
char str[32];
/* 取得命令后第一个参数,即要解析的域名或主机名 */
ptr = argv[1];
/* 调用gethostbyname()。调用结果都存在hptr中 */
if( (hptr = gethostbyname(ptr) ) == NULL )
{
printf("gethostbyname error for host:%s/n", ptr);
return 0; /* 如果调用gethostbyname发生错误,返回1 */
}
/* 将主机的规范名打出来 */
printf("official hostname:%s/n",hptr->h_name);
/* 主机可能有多个别名,将所有别名分别打出来 */
for(pptr = hptr->h_aliases; *pptr != NULL; pptr++)
printf(" alias:%s/n",*pptr);
/* 根据地址类型,将地址打出来 */
switch(hptr->h_addrtype)
{
case AF_INET:
case AF_INET6:
pptr=hptr->h_addr_list;
/* 将刚才得到的所有地址都打出来。其中调用了inet_ntop()函数 */
for(;*pptr!=NULL;pptr++)
printf(" address:%s/n", inet_ntop(hptr->h_addrtype, *pptr, str, sizeof(str)));
break;
default:
printf("unknown address type/n");
break;
}
return 0;
}
网络字节序与主机字节序
不同的CPU有不同的字节序类型 这些字节序是指整数在内存中保存的顺序 这个叫做主机序
最常见的有两种
1. Little endian:将低序字节存储在起始地址
2. Big endian:将高序字节存储在起始地址
LE little-endian
最符合人的思维的字节序
地址低位存储值的低位
地址高位存储值的高位
怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说
低位值小,就应该放在内存地址小的地方,也即内存地址低位
反之,高位值就应该放在内存地址大的地方,也即内存地址高位
BE big-endian
最直观的字节序
地址低位存储值的高位
地址高位存储值的低位
为什么说直观,不要考虑对应关系
只需要把内存地址从左到右按照由低到高的顺序写出
把值按照通常的高位到低位的顺序写出
两者对照,一个字节一个字节的填充进去
例子:在内存中双字0x01020304(DWORD)的存储方式
内存地址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04
例子:如果我们将0x1234abcd写入到以0x0000开始的内存中,则结果为
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列CPU都是little-endian的字节序.
网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。
为了进行转换 bsd socket提供了转换的函数 有下面四个
htons 把unsigned short类型从主机序转换到网络序
htonl 把unsigned long类型从主机序转换到网络序
ntohs 把unsigned short类型从网络序转换到主机序
ntohl 把unsigned long类型从网络序转换到主机序
在使用little endian的系统中 这些函数会把字节序进行转换
在使用big endian类型的系统中 这些函数会定义成空宏
同样 在网络程序开发时 或是跨平台开发时 也应该注意保证只用一种字节序 不然两方的解释不一样就会产生bug.
注:
1、网络与主机字节转换函数:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上运行不同的操作系统,字节序也是不同的,参见下表。
处理器 操作系统 字节排序
Alpha 全部 Little endian
HP-PA NT Little endian
HP-PA UNIX Big endian
Intelx86 全部 Little endian <-----x86系统是小端字节序系统
Motorola680x() 全部 Big endian
MIPS NT Little endian
MIPS UNIX Big endian
PowerPC NT Little endian
PowerPC 非NT Big endian <-----PPC系统是大端字节序系统
RS/6000 UNIX Big endian
SPARC UNIX Big endian
IXP1200 ARM核心 全部 Little endian
inet_addr函数
今天使用了在编程时使用到inet_addr函数,不太熟悉,找了点资料,整理如下。 inet_addr的功能是将一个ip地址字符串转换成一个整数值。一般的IP地址串格式为:'a.b.c.d'分成四段。 但是也会有分为1、2或3段的格式。下面我们来看看WIN2K下inet_addr函数的源码: unsigned long PASCAL inet_addr( IN const char *cp ) { register unsigned long val, base, n; register char c; unsigned long parts[4], *pp = parts; WS_ENTER( "inet_addr", (PVOID)cp, NULL, NULL, NULL ); again: /* * Collect number up to ``.''. * Values are specified as for C: * 0x=hex, 0=octal, other=decimal. */ val = 0; base = 10; //每段中根据中根据前缀知道其使用的进制。 if (*cp == '0') { //0X前缀为十六进制;0前缀为八进制;缺省为十进制 base = 8, cp++; if (*cp == 'x' || *cp == 'X') base = 16, cp++; } //下面这段代码是用来取得IP地址的一段将其转换值整数 while (c = *cp) { if (isdigit(c)) { //若为数字,则将其转换至数字进行计算 val = (val * base) + (c - '0'); //注意,在W2K下这儿有一个BUG,因为当为8进制时没有 cp++; //检查是否为8、9数字;这个问题在XP下修正了。 continue; } if (base == 16 && isxdigit(c)) { //当为16进制时,检查是否为‘a’~ 'f'字母 val = (val << 4) + (c + 10 - (islower(c) ? 'a' : 'A')); cp++; continue; } break; } //当为‘.’时,此时表示地址段结束了。 if (*cp == '.') { /* * Internet format: * a.b.c.d * a.b.c (with c treated as 16-bits) * a.b (with b treated as 24 bits) */ /* GSS - next line was corrected on 8/5/89, was 'parts + 4' */ if (pp >= parts + 3) { //若为‘.’间隔,检查是否已经超过3个了。 WS_EXIT( "inet_addr", -1, TRUE );//因为最多为3个‘.’ return ((unsigned long) -1); //在W2K下可以看出允许直接以‘.’开头的IP地址 } //而在XP下是不允许的。 *pp++ = val, cp++; goto again; } /* * Check for trailing characters.//到此处时,要么结束,要么为出错字符 */ //只有为0或者空格是结束,否则出错。 if (*cp && !isspace(*cp)) { WS_EXIT( "inet_addr", -1, TRUE ); return (INADDR_NONE); } *pp++ = val; /* * Concoct the address according to * the number of parts specified. */ n = (unsigned long)(pp - parts); switch ((int) n) { case 1: /* a -- 32 bits */ //当为一个段a时,直接就是这个值。 val = parts[0]; break; case 2: /* a.b -- 8.24 bits */ //当为两个段a.b时,整数值构成XX XX XX XX if ((parts[0] > 0xff) || (parts[1] > 0xffffff)) { // -- -------- WS_EXIT( "inet_addr", -1, TRUE ); // a b return(INADDR_NONE); } val = (parts[0] << 24) | (parts[1] & 0xffffff); break; case 3: /* a.b.c -- 8.8.16 bits *///当为3个段a.b.c时,整数值构成XX XX XX XX if ((parts[0] > 0xff) || (parts[1] > 0xff) || // -- -- ----- (parts[2] > 0xffff)) { // a b c WS_EXIT( "inet_addr", -1, TRUE ); return(INADDR_NONE); } val = (parts[0] << 24) | ((parts[1] & 0xff) << 16) | (parts[2] & 0xffff); break; case 4: /* a.b.c.d -- 8.8.8.8 bits *///当为4个段a.b.c.d时,整数值构成XX XX XX XX if ((parts[0] > 0xff) || (parts[1] > 0xff) || // -- -- -- -- (parts[2] > 0xff) || (parts[3] > 0xff)) { // a b c d WS_EXIT( "inet_addr", -1, TRUE ); return(INADDR_NONE); } val = (parts[0] << 24) | ((parts[1] & 0xff) << 16) | ((parts[2] & 0xff) << 8) | (parts[3] & 0xff); break; default: WS_EXIT( "inet_addr", -1, TRUE ); return (INADDR_NONE); } val = htonl(val); WS_EXIT( "inet_addr", val, FALSE ); return (val); }