socket个别函数

最新推荐文章于 2024-07-12 02:44:29 发布

转载最新推荐文章于 2024-07-12 02:44:29 发布 · 426 阅读

文章标签：

#socket #网络 #存储 #null #motorola #internet

c++ 专栏收录该内容

85 篇文章

订阅专栏

gethostbyname用法

使用这个东西，首先要包含2个头文件：
#include <netdb.h>
#include <sys/socket.h>
struct hostent *gethostbyname(const char *name);
这个函数的传入值是域名或者主机名，例如"www.google.com","wpc"等等。
传出值，是一个hostent的结构（如下）。如果函数调用失败，将返回NULL。
struct hostent {
     char *h_name;
     char **h_aliases;
     int h_addrtype;
     int h_length;
     char **h_addr_list;
};
解释一下这个结构, 其中:
char *h_name 表示的是主机的规范名。例如www.google.com的规范名其实是www.l.google.com。
char **h_aliases 表示的是主机的别名。www.google.com就是google他自己的别名。有的时候，有的主机可能有好几个别名，这些，其实都是为了易于用户记忆而为自己的网站多取的名字。
int h_addrtype 表示的是主机ip地址的类型，到底是ipv4(AF_INET)，还是ipv6(AF_INET6)
int h_length 表示的是主机ip地址的长度
int **h_addr_lisst 表示的是主机的ip地址，注意，这个是以网络字节序存储的。千万不要直接用printf带%s参数来打这个东西，会有问题的哇。所以到真正需要打印出这个IP的话，需要调用inet_ntop()。
const char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt) ：
这个函数，是将类型为af的网络地址结构src，转换成主机序的字符串形式，存放在长度为cnt的字符串中。
这个函数，其实就是返回指向dst的一个指针。如果函数调用错误，返回值是NULL。
下面是例程，有详细的注释。
#include <netdb.h>
#include <sys/socket.h>
int main(int argc, char **argv)
{
char *ptr,**pptr;
struct hostent *hptr;
char str[32];
/* 取得命令后第一个参数，即要解析的域名或主机名 */
ptr = argv[1];
/* 调用gethostbyname()。调用结果都存在hptr中 */
if( (hptr = gethostbyname(ptr) ) == NULL )
{
printf("gethostbyname error for host:%s/n", ptr);
return 0; /* 如果调用gethostbyname发生错误，返回1 */
}
/* 将主机的规范名打出来 */
printf("official hostname:%s/n",hptr->h_name);
/* 主机可能有多个别名，将所有别名分别打出来 */
for(pptr = hptr->h_aliases; *pptr != NULL; pptr++)
printf(" alias:%s/n",*pptr);
/* 根据地址类型，将地址打出来 */
switch(hptr->h_addrtype)
{
case AF_INET:
case AF_INET6:
pptr=hptr->h_addr_list;
/* 将刚才得到的所有地址都打出来。其中调用了inet_ntop()函数 */
for(;*pptr!=NULL;pptr++)
printf(" address:%s/n", inet_ntop(hptr->h_addrtype, *pptr, str, sizeof(str)));
break;
default:
printf("unknown address type/n");
break;
}
return 0;
}

网络字节序与主机字节序

不同的CPU有不同的字节序类型这些字节序是指整数在内存中保存的顺序这个叫做主机序
最常见的有两种
1． Little endian：将低序字节存储在起始地址
2． Big endian：将高序字节存储在起始地址

LE little-endian
最符合人的思维的字节序
地址低位存储值的低位
地址高位存储值的高位
怎么讲是最符合人的思维的字节序，是因为从人的第一观感来说
低位值小，就应该放在内存地址小的地方，也即内存地址低位
反之，高位值就应该放在内存地址大的地方，也即内存地址高位

BE big-endian
最直观的字节序
地址低位存储值的高位
地址高位存储值的低位
为什么说直观，不要考虑对应关系
只需要把内存地址从左到右按照由低到高的顺序写出
把值按照通常的高位到低位的顺序写出
两者对照，一个字节一个字节的填充进去

例子：在内存中双字0x01020304(DWORD)的存储方式

内存地址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04

例子：如果我们将0x1234abcd写入到以0x0000开始的内存中，则结果为
      big-endian  little-endian
0x0000  0x12      0xcd
0x0001  0x23      0xab
0x0002  0xab      0x34
0x0003  0xcd      0x12
x86系列CPU都是little-endian的字节序.

网络字节顺序是TCP/IP中规定好的一种数据表示格式，它与具体的CPU类型、操作系统等无关，从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。

为了进行转换 bsd socket提供了转换的函数有下面四个
htons 把unsigned short类型从主机序转换到网络序
htonl 把unsigned long类型从主机序转换到网络序
ntohs 把unsigned short类型从网络序转换到主机序
ntohl 把unsigned long类型从网络序转换到主机序

在使用little endian的系统中这些函数会把字节序进行转换
在使用big endian类型的系统中这些函数会定义成空宏

同样在网络程序开发时或是跨平台开发时也应该注意保证只用一种字节序不然两方的解释不一样就会产生bug.

注：
1、网络与主机字节转换函数:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上运行不同的操作系统，字节序也是不同的，参见下表。
处理器    操作系统    字节排序
Alpha    全部    Little endian
HP-PA    NT    Little endian
HP-PA    UNIX    Big endian
Intelx86    全部    Little endian <-----x86系统是小端字节序系统
Motorola680x()    全部    Big endian
MIPS    NT    Little endian
MIPS    UNIX    Big endian
PowerPC    NT    Little endian
PowerPC    非NT    Big endian  <-----PPC系统是大端字节序系统
RS/6000    UNIX    Big endian
SPARC    UNIX    Big endian
IXP1200 ARM核心    全部    Little endian

inet_addr函数

今天使用了在编程时使用到inet_addr函数，不太熟悉，找了点资料，整理如下。
inet_addr的功能是将一个ip地址字符串转换成一个整数值。一般的IP地址串格式为：'a.b.c.d'分成四段。
但是也会有分为1、2或3段的格式。下面我们来看看WIN2K下inet_addr函数的源码：

unsigned long PASCAL
inet_addr(
    IN const char *cp
    )
{
        register unsigned long val, base, n;
        register char c;
        unsigned long parts[4], *pp = parts;

        WS_ENTER( "inet_addr", (PVOID)cp, NULL, NULL, NULL );
again:
        /*
         * Collect number up to ``.''.
         * Values are specified as for C:
         * 0x=hex, 0=octal, other=decimal.
         */
        val = 0; base = 10;  //每段中根据中根据前缀知道其使用的进制。
        if (*cp == '0') {    //0X前缀为十六进制；0前缀为八进制；缺省为十进制
                base = 8, cp++;
                if (*cp == 'x' || *cp == 'X')
                        base = 16, cp++;
	}
	
        //下面这段代码是用来取得IP地址的一段将其转换值整数
        while (c = *cp) {
                if (isdigit(c)) {                         //若为数字，则将其转换至数字进行计算
                        val = (val * base) + (c - '0');   //注意，在W2K下这儿有一个BUG，因为当为8进制时没有
                        cp++;                             //检查是否为8、9数字；这个问题在XP下修正了。
                        continue;
                }
                if (base == 16 && isxdigit(c)) {  //当为16进制时，检查是否为‘a’~ 'f'字母
                        val = (val << 4) + (c + 10 - (islower(c) ? 'a' : 'A'));
                        cp++;
                        continue;
                }
                break;
        }
       //当为‘.’时，此时表示地址段结束了。
        if (*cp == '.') {
                /*
                 * Internet format:
                 *      a.b.c.d
                 *      a.b.c   (with c treated as 16-bits)
                 *      a.b     (with b treated as 24 bits)
                 */
                /* GSS - next line was corrected on 8/5/89, was 'parts + 4' */
                if (pp >= parts + 3) {                   //若为‘.’间隔，检查是否已经超过3个了。
                        WS_EXIT( "inet_addr", -1, TRUE );//因为最多为3个‘.’
                        return ((unsigned long) -1);     //在W2K下可以看出允许直接以‘.’开头的IP地址    
                }                                        //而在XP下是不允许的。
                *pp++ = val, cp++;
                goto again;
        }

        /*
         * Check for trailing characters.//到此处时，要么结束，要么为出错字符
         */                              //只有为0或者空格是结束，否则出错。       
        if (*cp && !isspace(*cp)) {
                WS_EXIT( "inet_addr", -1, TRUE );
                return (INADDR_NONE);
        }
        *pp++ = val;
        /*
         * Concoct the address according to
         * the number of parts specified.
         */
        n = (unsigned long)(pp - parts);
        switch ((int) n) {

        case 1:                         /* a -- 32 bits */  //当为一个段a时，直接就是这个值。
                val = parts[0];
                break;

        case 2:                         /* a.b -- 8.24 bits */    //当为两个段a.b时，整数值构成XX  XX XX XX
                if ((parts[0] > 0xff) || (parts[1] > 0xffffff)) { //                       --  --------
                    WS_EXIT( "inet_addr", -1, TRUE );             //                        a       b   
                    return(INADDR_NONE);
                }
                val = (parts[0] << 24) | (parts[1] & 0xffffff);
                break;

        case 3:                         /* a.b.c -- 8.8.16 bits *///当为3个段a.b.c时，整数值构成XX  XX   XX XX
                if ((parts[0] > 0xff) || (parts[1] > 0xff) ||     //                         --  --   -----
                    (parts[2] > 0xffff)) {                        //                          a    b     c 
                    WS_EXIT( "inet_addr", -1, TRUE );
                    return(INADDR_NONE);
                }
                val = (parts[0] << 24) | ((parts[1] & 0xff) << 16) |
                        (parts[2] & 0xffff);
                break;

        case 4:                         /* a.b.c.d -- 8.8.8.8 bits *///当为4个段a.b.c.d时，整数值构成XX  XX   XX   XX
                if ((parts[0] > 0xff) || (parts[1] > 0xff) ||        //                           --  --   --   --
                    (parts[2] > 0xff) || (parts[3] > 0xff)) {        //                           a    b    c    d 
                    WS_EXIT( "inet_addr", -1, TRUE );
                    return(INADDR_NONE);
                }
                val = (parts[0] << 24) | ((parts[1] & 0xff) << 16) |
                      ((parts[2] & 0xff) << 8) | (parts[3] & 0xff);
                break;

        default:
                WS_EXIT( "inet_addr", -1, TRUE );
                return (INADDR_NONE);
        }
        val = htonl(val);
        WS_EXIT( "inet_addr", val, FALSE );
        return (val);
}