InternetReadFile 处理大数据

本文介绍了一种使用C++实现的网页数据抓取方法,通过逐块读取并处理网页内容,有效避免了大量数据引起的缓存错乱问题。文中详细展示了如何利用WinINet API进行网页请求及数据读取,并通过休眠操作确保缓存更新。

    在获取网页内容,数据量如果比较大,可能会出现获取的内容错乱,此时可以通过停顿来使得缓存内容更新。



#include <iostream>
#include <fstream>
#include <Windows.h>
#include <wininet.h>
#define MAXBLOCKSIZE 1024
#pragma   comment   (lib,   "wininet.lib")

bool GetUrlInfo(const wchar_t* Url, std::string &rst)

bool isGet = false;
HINTERNET hSession = InternetOpen(L"RookIE/1.0", INTERNET_OPEN_TYPE_PRECONFIG, NULL, NULL, 0);
if (hSession != NULL)
{
HINTERNET handle2 = InternetOpenUrl(hSession, Url, NULL, 0, INTERNET_FLAG_DONT_CACHE, 0);
if (handle2 != NULL)

char Temp[MAXBLOCKSIZE];
char TempChange[MAXBLOCKSIZE * 3] = { 0 }; 
ULONG Number = 1;
 
int step = 0;
while (Number > 0)
{
isGet = true;
InternetReadFile(handle2, Temp, MAXBLOCKSIZE - 1, &Number);
int i = 0;
for (; i < Number; i++, step++)
{
TempChange[step] = Temp[i];
if (Temp[i] == '}')
{
TempChange[step + 1] = 0;
break;
}

rst += TempChange; 
if (i + 1 < Number)
{
step = strlen(&Temp[i + 1]) - 10;
strcpy_s(TempChange, &Temp[i + 1]);
}

Sleep(10);  //等待缓存数据
}  


InternetCloseHandle(handle2);
handle2 = NULL;
}
InternetCloseHandle(hSession);
hSession = NULL; 
}
return isGet;
}

`InternetReadFile`是WinINet库中的函数,用于从打开的Internet资源中读取数据。以下是`InternetReadFile`函数的基本用法: ```cpp #include <windows.h> #include <wininet.h> #include <iostream> #pragma comment(lib, "wininet.lib") int main() { HINTERNET hInternet = InternetOpen(L"HTTPGET", INTERNET_OPEN_TYPE_DIRECT, NULL, NULL, 0); if (hInternet == NULL) { std::cout << "Failed to open internet." << std::endl; return 1; } HINTERNET hConnect = InternetOpenUrl(hInternet, L"http://www.example.com", NULL, 0, INTERNET_FLAG_RELOAD, 0); if (hConnect == NULL) { std::cout << "Failed to open URL." << std::endl; InternetCloseHandle(hInternet); return 1; } char buffer[4096]; DWORD bytesRead = 0; while (InternetReadFile(hConnect, buffer, sizeof(buffer), &bytesRead) && bytesRead > 0) { // 在这里处理读取到的数据 std::cout.write(buffer, bytesRead); } InternetCloseHandle(hConnect); InternetCloseHandle(hInternet); return 0; } ``` 在这个示例代码中,我们使用`InternetOpen`函数打开一个Internet会话,然后使用`InternetOpenUrl`函数打开指定URL的连接。请将`http://www.example.com`替换为你想要请求的URL。 然后,我们使用`InternetReadFile`函数循环读取连接中的数据。在每次调用`InternetReadFile`后,我们检查`bytesRead`变量来确定是否成功读取数据,并在循环中处理读取到的数据。在这个示例中,我们简单地将数据写入到标准输出。 请注意,示例代码中的错误处理部分被简化了,实际应用中可能需要更完善的错误处理。 希望这个示例代码可以帮助你使用`InternetReadFile`函数从Internet资源中读取数据。如果有任何进一步的问题,请随时提问。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值