在vb.net中使用webbrowser控件和mshtml以及流操作体会(vb.net内嵌IE,拆取 Web 页)(原创)

本文介绍了在vb.net环境下,如何利用WebBrowser控件和mshtml库来实现网页抓取。通过创建输入框和按钮,发送POST请求获取网页数据,并将结果保存为临时文件,最后在WebBrowser控件中加载展示。虽然尝试了直接在控件中写入HTML,但遇到了一些问题,如双引号处理和只成功一次的情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求为:到某一网站抓取查询结果.环境为vb.net

从0开始,一开始具体需要用到.net里的具体什么东东都不清楚,于是就一顿瞎搜索.又是google,又是baidu,yisou......胡乱搜的内容有.net ie,拆分网页 .net,内嵌ie等等.没过多久能得知webbrowser这个控件.

其中对我有帮助比较大的文章是http://www.microsoft.com/china/msdn/Archives/workshop/scrape.asp

只是这里介绍的vb环境.到.net也没什么太大差别,别笑!我最开始找shdocvw.dllmshtml.dll添加引用时候都费了半天劲.因为大家都说webbrowser.而.net里写的是microsoft web 浏览器..

先按照上面的文章练一练!

不说废话了.

先做一个输入框,和一个按钮,供输入信息,和提交信息.

在按纽的click事件中写:

            Dim postdata As String() = {"searchText=" + Me.searchText.Text}
            Dim strUrl As String = "http://"
            Dim SessionHtml As String = PostDate(strUrl, postdata)
            '产生临时文件
            Dim sw As StreamWriter = New StreamWriter("D:/1.htm", False, Encoding.GetEncoding("GB2312"))
            sw.WriteLine(SessionHtml)
            sw.Close()
            Me.AxWebBrowserFill.Navigate("D:/1.htm")

 

PostDate函数如下:

Public Function PostDate(ByVal url As String, ByVal PostData() As String) As String

Dim Post As String = ""
            '拼接成传递变量
            For Each s As String In PostData
                Post += s + "&"
            Next
            Post = Post.Substring(0, Post.Length - 1)
            Dim html As String = ""

            Dim encoding As Encoding = encoding.GetEncoding("GB2312")
            Dim data As Byte() = encoding.GetBytes(Post)
            Dim myRequest As HttpWebRequest = CType(WebRequest.Create(url), HttpWebRequest)
            myRequest.Method = "post"
            myRequest.ContentType = "application/x-www-form-urlencoded"
            'myRequest.ContentType = "text/asp"
            myRequest.ContentLength = data.Length
            Dim newStream As Stream = myRequest.GetRequestStream()
            newStream.Write(data, 0, data.Length)
            newStream.Close()
            Dim resp As HttpWebResponse = CType(myRequest.GetResponse(), HttpWebResponse)
            Dim sr As StreamReader = New StreamReader(resp.GetResponseStream(), System.Text.Encoding.GetEncoding("GB2312"))
            '返回html代码的字符串
            html = sr.ReadToEnd()
            sr.Close()
            Return html

 End Function

这样就可以了.

至于直接把html显示在webbrowser控件中,而不通过临时文件,在网上搜到的都是delphi办法.而.net似乎没有完美的解决办法.

 

曾经试过:

'AxWebBrowserFill.Navigate(SessionHtml)
            'Me.AxWebBrowserFill.Document.write(SessionHtml + "haga")
            'Me.axScriptLet.url = "about:blank" + SessionHtml
            'Me.AxWebBrowserFill.Document.write(SessionHtml)
            'doc = Me.AxWebBrowserFill.Document
            'doc.body.innerHTML = SessionHtml
            'doc.write(SessionHtml)

 

往往只是第一次成功,而且中间会涉及到html内双引号的问题.

也有网上说按如下方法:


            ''在WebBrowser中显示报告内容字段
            'Dim doc As IHTMLDocument2 = CType(AxWebBrowserFill.Document, IHTMLDocument2)
            'Dim bodyElement As IHTMLElement = CType(doc.body, IHTMLElement)
            ''bodyElement.innerHTML = SessionHtml + "haga"

而这个方法我就没有奏效过!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值