实现对HTTP协议工作过程的模拟

本文介绍了一个使用C++和Winsock实现的简易HTTP网页抓取程序。该程序通过发送HTTP请求来获取指定URL的内容,并将响应数据保存到本地文件中进行查看。涉及套接字编程、DNS解析等关键技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#include <iostream>
#include <cstring>
#include <string>
#include <Winsock2.h>
#pragma comment(lib,"Ws2_32.lib")
using namespace std;

int main(){
 SOCKET sock;
 sockaddr_in addrSrv;
 string host="www.sina.com.cn";
 hostent *haddr;
 bool label=false;
 int num=0;
 int jmp;
 string content;
 char *buffer=new char[1024];
 content.empty();
 WSADATA wsadata;
 FILE *fp=fopen("./temp.html","a+");

 if(WSAStartup(MAKEWORD(1,1),&wsadata)!=0){
  cout<<"WSAStartup() error!"<<endl;
  return 0;
 }
 if(LOBYTE(wsadata.wVersion)!=1||HIBYTE(wsadata.wVersion)!=1){
  WSACleanup();
  cout<<"WSAStartup() error!"<<endl;
  return 0;
 }

 if((sock=socket(AF_INET,SOCK_STREAM,0))==-1){
  cout<<"socket() error!"<<endl;
  return 0;
 }
 if((haddr=gethostbyname(host.c_str()))==NULL){
  cout<<"gethostbyname() error!"<<endl;
  return 0;
 }
 addrSrv.sin_addr=*((struct in_addr *)*(haddr->h_addr_list));
 //cout<<inet_ntoa(addrSrv.sin_addr)<<endl;
 addrSrv.sin_family=AF_INET;
 addrSrv.sin_port=htons(80);

 if(connect(sock,(sockaddr *)&addrSrv,sizeof(addrSrv))==-1){
  cout<<"connect() error!"<<endl;
  return 0;
 }

 send(sock,"GET / HTTP/1.1\r\n",strlen("GET / HTTP/1.1\r\n"),0);
 send(sock,"Host:222.25.185.203\r\n",strlen("Host:222.25.185.203\r\n"),0);
 send(sock,"Accept:application/x-coment,image/gif,image/x-xbitmap,image/jpg,image/pjpeg,*/*\r\n",strlen("Accept:application/x-coment,image/gif,image/x-xbitmap,image/jpg,image/pjpeg,*/*\r\n"),0);
 send(sock,"User-Agent:Mozilla/4.0\r\n",strlen("User-Agent:Mozilla/4.0\r\n"),0);
 send(sock,"Connection:Keep-Alive\r\n",strlen("Connection:Keep-Alive\r\n"),0);
 send(sock,"\r\n",strlen("\r\n"),0);
 send(sock,"\r\n",strlen("\r\n"),0);//添加两个回车换行

 jmp=0;
 while(!label){
  num=recv(sock,buffer,1,0);
  content+=*buffer;
  if(num<0){
   label=true;
  }
  switch(*buffer){
  case '\r':
   break;
  case '\n':
   if(jmp==0)
    label=true;
   jmp=0;
   break;
  default:
   jmp++;
   break;
  }
  //cout<<buffer[0];
 }
 cout<<content;
 do{
  memset(buffer,'\0',1024);
  num=recv(sock,buffer,1024,0);
  if(num<0)
   break;
  //content+=buffer;
  content.append(buffer);
  fwrite(buffer,strlen(buffer),1,fp);
  //fputs(buffer,fp);
  //cout<<buffer;
 }while(num>0);
 closesocket(sock);

 if(WSACleanup()!=0){
  cout<<"WSACleanup() error!"<<endl;
 }
 //cout<<content<<endl;
 fclose(fp);
 ShellExecute(NULL,"open",".\\temp.html",NULL,NULL,SW_SHOWNORMAL);
 return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值