用Socket和MSHTML对象模型创建自己的浏览器

HTTP协议和WEB浏览器的诞生给我们的网络增加了更多的精彩。但在实际应用中我们可能会有不同的需要而不是单纯的使用浏览器,譬如在我们的应用程序中加入浏览互联网的功能。微软的 ChtmlView类很方便的实现了网页浏览。但是它很不灵活,无法使用户动态地在网页上修改自己想要的元素。本文探讨一些方法使用Socket传输Html文档,利用微软的动态MSHTML对象模型实现一些浏览器的内部机制。

 

大家知道HTML文档是由标记语言构成,即俗称的Tag。微软的浏览器IE对于这些标记实现了一一对应的对象模型(objectmodel),由MSHTML.DLL封装。IE浏览器的实现也是由MSHTML.DLL来实现的。通过MSHTML.DLL我们可以直接操作对象模型的属性,方法。MSHTML的对象模型是基于COM组件对象的,对象的接口是基于Idispatch,操作MSHTML对象模型必须通过Idispatch接口。MSHTML中封装了许多这样的接口,例如,IhtmlAnchorElement接口对应与HTML文档中的超连接标记<A>,IHtmlHRElement接口对应<HR>标记,IhtmlTable接口对应<table>标记。其中最重要的是IhtmlDocument2接口,它对应Document组件。Document组件既相当于HTML文档。使用过Javascript的人对它应比较熟悉。

 

下面我们举例来讲解MSHTML的应用。在举例之前我先讲述一下Socket和HTTP协议。HTTP协议通过TCP连接服务器和Client,它工作在80端口。HTTP通过Client和Server之间的请求/应答机制进行通讯。HTTP消息分为Request和Response。每一种消息由开始行,消息头和消息体组成。形式如下:

 

generic-message = start-line

 

*message-header

 

CRLF

 

[ message-body ]

 

 

 

start-line的形式如下:

 

start-line = Request-Line | Status-Line

 

Request-Line为Client向Server发出的请求,形式如下:

 

Request-Line = Method SP Request-URI SP HTTP-Version CRLF

 

Method 包括GET,POST等,在本例中我们只简单的使用GET向服务器发出请求。

 

详细的HTTP协议请参考RFC2068。

 

在VC++中建立新的单文档EXE工程文件,为了使用MSHTML我们的视图类继承自ChtmlView。ChtmlView类封装了MSHTML接口。给工程中加入Socket类。

 

class CHttpSocket : public CSocket

 

{

 

………………

 

protected:

 

CWnd * m_pParentWnd;

 

}

 

其中m_pParentWnd指向我们的视图类,用于传送消息。在视图类中定义Socket。

 

class CSkhttpView : public CHtmlView

 

{

 

protected: // create from serialization only

 

CSkhttpView();

 

DECLARE_DYNCREATE(CSkhttpView)

 

…………….

 

protected:

 

CHttpSocket m_socket;

 

IHTMLDocument2 * phmDoc2;

 

……..

 

}

 

phmDoc2为IHTMLDocument2接口。初始化Socke,连接我们欲登录的站点,假设为www.163.net。

 

CSkhttpView::CSkhttpView()

 

{

 

// TODO: add construction code here

 

BOOL bRet=m_socket.Create(0,SOCK_STREAM,NULL);

 

if(!bRet)

 

MessageBox("socket create error",NULL,MB_OK);

 

m_socket.SetParentWnd(this);

 

if(!m_socket.Connect(www.163.net,80))

 

MessageBox(“socket connect error”,NULL,MB_OK);

 

}

 

下面我们取得IhtmlDocument2的接口。此接口的获得一般有两种方法。一是使用CoCreateInstance,然后调用QueryInterface。另一种是使用MSHTML控件对象的get_Document,在ChtmlView类中封装了这个接口。我们使用后一种。需要注意的是,我们需要在ChtmlView生成IhtmlDocument对象后才能获得它的接口。

 

void CSkhttpView::OnInitialUpdate()

 

{

 

Navigate2(“about:blank”);

 

}

 

void CSkhttpView::OnDocumentComplete(LPCTSTR lpszURL)

 

{

 

LPDISPATCH lpdisp;

 

HRESULT hr;

 

lpdisp=GetHtmlDocument();

 

hr=lpdisp->QueryInterface(IID_IHTMLDocument2,(void **)&phmDoc2);

 

}

 

在ChtmlView初始化时调用Navigate2()产生空文档,文档产生后调用GetHtmlDocument获得一个Idispatch()接口,调用QueryInterface获得IHTMLDocument2接口。

 

void CSkhttpView::OnReceiveMessage(WPARAM wParam,LPARAM lParam)

 

{

 

HRESULT hr;

 

char buf[5000];

 

int inum;

 

IHTMLElement * pEleBody;

 

if(wParam==0)

 

{

 

inum=m_socket.Receive(buf,sizeof(buf),0);

 

buf[inum]=0;

 

_bstr_t bsrBody(buf);

 

hr=phmDoc2->get_body(&pEleBody);

 

hr=pEleBody->put_innerHTML(bsrBody);

 

}

 

}
 

 

void CSkhttpView::OnControlSend()

 

{

 

// TODO: Add your command handler code here

 

char buf[1000];

 

wsprintf(buf,"GET http://www.163.net HTTP/1.1/r/n/r/n");

 

int iRet=m_socket.Send(buf,lstrlen(buf),0);

 

if(iRet==SOCKET_ERROR)

 

MessageBox(“socket send error”,NULL,MB_OK);

 

}

 

我们向服务器发送HTTP协议的请求”GET http://www.163.net HTTP/1.1/r/n/r/n”,它取回指定URI地址的网页。服务器发出回应我们通过Socket接受。IhtmlDocument2内含许多对象借口,通过许多的put_,get_方法我们可以获得这些对象的属性,事件,方法。本例中我们获得body对象,它对应于HTML文挡中<body></body>对象。通过IhtmlDocument2的get_body()得到指定body对象的IHTMLElement接口,调用IHTMLElement接口的put_innerHTML()将接受到的内容放入Document中。此时在我们的视图中就会显示网页。

 

本文只是简略的介绍了一下MSHTML对象,它里面实际包含了许多的接口和函数,通过这些接口我们可以任意设计我们自己风格的浏览器。有兴趣的同志可以参阅MSDN文档。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值