linux获取网站源码,Linux获取网页源码的几种方法 - 遗世之都 - ITeye技术网站

本文介绍了两种在Linux环境下获取网页源码的方法:一是使用Wget命令,通过`wget -q URL`来下载网页并读取源码;二是使用Socket编程,通过发送GET请求获取。此外,还提到了Curl库作为另一种获取网页源码的工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

JavaEye博客还是本科做毕业设计时候开通的,基本上荒废了,现在决定记录下平时编程遇到的问题或者解决方案。

第一个为利用linux下的工具来获取网页源码,我用的是Wget,也可以使用Curl,curl的话更加的灵活,可以设置很多参数

C++代码

//通过Wget来获取网页

string GetHtmlByWget(string url)

{

//获取待下载网页文件名

string fileName = url.substr((int)url.find_last_of("/") + 1);

if(fileName !="")

{

string strCom = "wget -q ";//wget命令,-q表示不显示下载信息

strCom.append(url);

system(strCom.c_str()); //执行wget

ifstream fin(fileName.c_str());

if(!fin)

{

return"";

}

string strHtml = "";

charchTemp[1024] ="";

//读取网页文件到内存中

while(fin.getline(chTemp , 1024))

{

strHtml.append(string(chTemp));

strcpy(chTemp , "");

}

fin.close();

strCom = "rm -f ";//删除文件命令,-f表示直接删除不做任何提示

strCom.append(fileName);

system(strCom.c_str()); //删除刚才下载下来的文件

returnstrHtml;//返回网页源码

}

else

{

return"";

}

}

//通过Wget来获取网页

string GetHtmlByWget(string url)

{

//获取待下载网页文件名

string fileName = url.substr((int)url.find_last_of("/") + 1);

if(fileName != "")

{

string strCom = "wget -q "; //wget命令,-q表示不显示下载信息

strCom.append(url);

system(strCom.c_str()); //执行wget

ifstream fin(fileName.c_str());

if(!fin)

{

return "";

}

string strHtml = "";

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值