ASP.NET C# 小偷/采集 类

本文介绍了一种使用C#实现的网页数据抓取方法,包括获取网页源码及从源码中截取特定内容的技术。该方法利用了System.Net命名空间下的WebClient类来下载网页数据,并提供了两种不同的字符集选项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

小偷程序类

ContractedBlock.gifExpandedBlockStart.gifCode
using System;
using System.Net;
using System.Text;

/// <summary>
/// Collect 的摘要说明
/// </summary>
public class Collect
{
    
// 获取网页源码
    public static string GetHttpPage(string HttpUrl, bool CharSet)
    {
        WebClient wc 
= new WebClient();
        
byte[] PageData = wc.DownloadData(HttpUrl);
        
string PageHtml;
        
if(CharSet)
            PageHtml 
= Encoding.Default.GetString(PageData);
        
else
            PageHtml 
= Encoding.UTF8.GetString(PageData);
        
return PageHtml;
    }

    
// 截取字符串
    public static string GetBody(string Constr, string StartStr, string OverStr, bool IncluL, bool IncluR)
    {
        
string ConstrTemp;
        
int Start, Over;
        ConstrTemp 
= Constr.ToLower();
        StartStr 
= StartStr.ToLower();
        OverStr 
= OverStr.ToLower();

        Start 
= ConstrTemp.IndexOf(StartStr) + StartStr.Length;
        
if (IncluL)
        {
            Start 
-= StartStr.Length;
        }
        ConstrTemp 
= ConstrTemp.Substring(Start);

        Over 
= ConstrTemp.IndexOf(OverStr);
        
if (IncluR)
        {
            Over 
+= OverStr.Length;
        }
        ConstrTemp 
= ConstrTemp.Substring(0, Over);

        
return ConstrTemp;
    }
}

转载于:https://www.cnblogs.com/0754ydj/archive/2008/11/24/1340044.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值