用C#写asp.net搜索蜘蛛代码程序

本文介绍了一种通过分析HTTP用户代理字符串来判断访问者是否为搜索引擎爬虫的方法,并记录爬虫信息。此外,还展示了如何针对爬虫展示特定链接。

 

protected bool robot()
    {
        bool brtn = false;
        string king_robots = "Baiduspider+@Baidu|Googlebot@Google|ia_archiver@Alexa|IAArchiver@Alexa|ASPSeek@ASPSeek|YahooSeeker@Yahoo|sohu-search@Sohu|help.yahoo.com/help/us/ysearch/slurp@Yahoo|sohu-search@SOHU|MSNBOT@MSN";
        string ls_spr;

        ls_spr=Request.ServerVariables["http_user_agent"].ToString();
        char[] delimiterChars = { '|' };
        char[] x = { '@' };
        string[] I1 = king_robots.Split(delimiterChars);

        for (int i = 0; i < I1.Length; i++)
        {
            string[] spider = I1[i].Split(x);
            if (ls_spr.IndexOf(spider[0].ToString()) > -1)
            {
                brtn = true;
                logrobots(spider[1].ToString());
                break;
            }
        }
        return brtn;
    }
    protected void logrobots(string spr)
    {

        spr = DateTime.Now.ToString() + "|" + spr;
        StreamWriter sw;
        try
        {
           sw = new StreamWriter(Server.MapPath("log.txt"), true, System.Text.Encoding.GetEncoding("gb2312")); //参数为false重写,为true在后面加入               sw.WriteLine(spr);
            sw.Close();
        }
        finally
        {

        }
    
    }
完成。

下面的为在别的网站上加链接。只有蜘蛛看到。
protected void addcontent()
    {
        StreamReader sr ;
        try
        {
            sr = new StreamReader(Server.MapPath("logurl.txt"), System.Text.Encoding.GetEncoding("gb2312"));
            String input;
            char[] UPer = { '|' };
            char[] xx = { '@' };
            while ((input = sr.ReadLine()) != null)
            {

                sb = sb + "<p>";
                string[] url = input.Split(UPer);
                for (int i = 0; i < url.Length; i++)
                {
                    string[] tt = url[i].Split(xx);
                    if (tt[0].Length > 0)
                    {
                        sb = sb + "<a href=" + tt[0].ToString() + " target=_blank>" + tt[1].ToString() + "</a>|";
                    }
                }
                sb = sb + "</p>";
            }
            sr.Close();

        }
        finally
        {

        }

     
    }

转载于:https://www.cnblogs.com/pengxianwei/archive/2009/03/14/1411222.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值