ASP.Net、C#实现网页小偷程序

本文介绍了一个使用ASP.NET和C#实现的简单网页抓取程序,该程序能够从指定URL下载网页内容,并根据网页的实际编码将其转换为字符串形式进行输出。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ASP.Net (GetWebcontent.aspx)



<%@ Page Language="C#" %>

<%@ Import Namespace="System.Net" %>

<%@ Import Namespace="System.Text" %>

<script runat=server>

   //***********************************************************

   //*              

   //*    使用ASP.Net实现网站小偷的程序     

   //*       Written by 笑笑 2005-12-11       

   //*       网址:http://blog.hnce.net       

   //*       Email:hedongyang@gmail.com QQ:5364083    

   //*               

   //***********************************************************

void Page_Load(Object sender , EventArgs e) 

{

   string strurl="http://blog.hnce.net";    //欲获取的网页地址

   

   WebClient myWebClient=new WebClient();    //创建WebClient实例myWebClient

   

   //获取或设置用于对向 Internet 资源的请求进行身份验证的网络凭据。

   myWebClient.Credentials=CredentialCache.DefaultCredentials;

   

   //从资源下载数据并返回字节数组。(加@是因为网址中间有"/"符号)

   byte[] pagedata=myWebClient.DownloadData(strurl);

   

   //以下两句每次只要使用一条即可,功能是一样是用来转换字符集,根据获取网站页面的字符编码选择

   //string result=Encoding.Default.GetString(pagedata);        

   //如果获取网站页面采用的是GB2312,则使用这句

   string result=Encoding.UTF8.GetString(pagedata); 

   //如果获取网站页面采用的是UTF-8,则使用这句 

   //因为我的博客使用了UTF-8编码,所以在这里我使用这句

   Response.Write(result);   //在WEB页中显示获取的内容

}

</Script>

<html>

<head>

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

<title>无标题文档</title>

</head>



<body>

</body>

</html>



C# (GetWebcontent.cs)



/*

*********************************************************

*       

*  使用C#实现网站小偷的程序   

*       Written by 笑笑 2005-12-11   

*       网址:http://blog.hnce.net   

*       Email:hedongyang@gmail.com QQ:5364083 

*       

*********************************************************

*/

using System;

using System.Net;

using System.Text;



class GetWebcontent

{

 public static void Main()

 {           

     try

     {



  WebClient MyWebClient = new WebClient();



  MyWebClient.Credentials = CredentialCache.DefaultCredentials;



  Byte[] pageData = MyWebClient.DownloadData("http://blog.hnce.net");

  string pageHtml = Encoding.UTF8.GetString(pageData);

  Console.WriteLine(pageHtml);



     } 

     catch (WebException webEx)

     {

  Console.Write(webEx.ToString());

     }

 }

}









评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值