C#程序抓取网页实例

  1. using System;  
  2. using System.Collections.Generic;  
  3. using System.ComponentModel;  
  4. using System.Data;  
  5. using System.Drawing;  
  6. using System.Text;  
  7. using System.Windows.Forms;  
  8. using System.Net;  
  9. using System.IO;  
  10. using System.Text.RegularExpressions;  
  11. using System.Collections;  
  12. namespace CopyHtml  
  13. {  
  14.     public partial class Form1 : Form  
  15.     {  
  16.         public Form1()  
  17.         {  
  18.             InitializeComponent();  
  19.         }  
  20.         private void button1_Click(object sender, EventArgs e)  
  21.         {  
  22.             //获取指定网页中的源数据  
  23.             string rl;  
  24.             WebRequest Request = WebRequest.Create(textBox1.Text.Trim());  
  25.             WebResponse Response = Request.GetResponse();  
  26.             Stream resStream = Response.GetResponseStream();  
  27.             StreamReader sr = new StreamReader(resStream, Encoding.Default);  
  28.             StringBuilder sb = new StringBuilder();  
  29.             while ((rl = sr.ReadLine()) != null)  
  30.             {  
  31.                 sb.Append(rl);  
  32.             }  
  33.             textBox2.Text = sb.ToString();//抓取得到的源网页  
  34.             string he = textBox2.Text.ToString();  
  35.             textBox3.Text = stripHtml(he);//去除html标签后得到的源网页  
  36.             Match TitleMatch = Regex.Match(he, "<title>([^<]*)</title>", RegexOptions.IgnoreCase | RegexOptions.Multiline);//获取网页的标题  
  37.             string title = TitleMatch.Groups[1].Value;  
  38.             textBox4.Text = ("网页的标题是:" + title );  
  39.         }  
  40.         /// <summary>  
  41.         /// 去掉网页中的html标签  
  42.         /// </summary>  
  43.         /// <param name="strHtml">待转化的字符串</param>  
  44.         /// <returns></returns>  
  45.         private string stripHtml(string strHtml)  
  46.         {  
  47.             Regex objRegExp = new Regex("<(.|/n)+?>");  
  48.             string strOutput = objRegExp.Replace(strHtml, "");  
  49.             strOutput = strOutput.Replace("<""<");  
  50.             strOutput = strOutput.Replace(">"">");  
  51.             return strOutput;  
  52.         }  
  53.         // 提取HTML代码中的网址   
  54.         public static ArrayList GetHyperLinks(string htmlCode)  
  55.         {  
  56.             ArrayList al = new ArrayList();  
  57.             string strRegex = @"(href)[ ]*=[ ]*[""'][^""'#>]+[""']";  
  58.             Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);  
  59.             MatchCollection m = r.Matches(htmlCode);  
  60.             for (int i = 0; i <= m.Count - 1; i++)  
  61.             {  
  62.                 bool rep = false;  
  63.                 string strNew = m[i].ToString();  
  64.                 // 过滤重复的URL   
  65.                 foreach (string str in al)  
  66.                 {  
  67.                     if (strNew == str)  
  68.                     {  
  69.                         rep = true;  
  70.                         break;  
  71.                     }  
  72.                 }  
  73.                 if (!rep) al.Add(strNew);  
  74.             }  
  75.             al.Sort();  
  76.             return al;  
  77.         }  
  78.     }  
  79. }  
1. 用户与权限管理模块 角色管理: 学生:查看实验室信息、预约设备、提交耗材申请、参与安全考核 教师:管理课题组预约、审批学生耗材申请、查看本课题组使用记录 管理员:设备全生命周期管理、审核预约、耗材采购与分发、安全检查 用户操作: 登录认证:统一身份认证(对接学号 / 工号系统,模拟实现),支持密码重置 信息管理:学生 / 教师维护个人信息(联系方式、所属院系),管理员管理所有用户 权限控制:不同角色仅可见对应功能(如学生不可删除设备信息) 2. 实验室与设备管理模块 实验室信息管理: 基础信息:实验室编号、名称、位置、容纳人数、开放时间、负责人 功能分类:按学科(计算机实验室 / 电子实验室 / 化学实验室)标记,关联可开展实验类型 状态展示:实时显示当前使用人数、设备运行状态(正常 / 故障) 设备管理: 设备档案:名称、型号、规格、购置日期、单价、生产厂家、存放位置、责任人 全生命周期管理: 入库登记:管理员录入新设备信息,生成唯一资产编号 维护记录:记录维修、校准、保养信息(时间、内容、执行人) 报废处理:登记报废原因、时间,更新设备状态为 "已报废" 设备查询:支持按名称、型号、状态多条件检索,显示设备当前可用情况 3. 预约与使用模块 预约管理: 预约规则:学生可预约未来 7 天内的设备 / 实验室,单次最长 4 小时(可设置) 预约流程:选择实验室→选择设备→选择时间段→提交申请(需填写实验目的) 审核机制:普通实验自动通过,高危实验(如化学实验)需教师审核 使用记录: 签到 / 签退:到达实验室后扫码签到,离开时签退,系统自动记录实际使用时长 使用登记:填写实验内容、设备运行情况(正常 / 异常),异常情况需详细描述 违规管理:迟到 15 分钟自动取消预约,多次违规限制预约权限 4. 耗材与安全管理模块 耗材管理: 耗材档案:名称、规格、数量、存放位置、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值