最近弄的东西,需要获得一个网页中所有frame的html代码.
获取frame的源码是在OnDocumentComplete事件的处理函数中进行的.
void OnDocumentComplete(IDispatch *pDisp, VARIANT *URL);
参数 IDispatch *pDisp 是当前完成OnDocumentComplete的browser接口.可以通过判断其与一开始navigate用的webbrowser接口比较,来判断这个documentcomplete消息是主框架发出还是页面
参数URL代表当前发出OnDocumentComplete事件的frame的url,每个frame完成都会发出这个事件,这也是在多frame的页面中会接收到多个OnDocumentComplete消息的原因.
//通过pDisp查询发出当前事件的browser
IWebBrowser2Ptr pWebBrowser2;
hr = pDisp->QueryInterface(IID_IWebBrowser2,(void **)&pWebBrowser2);
//然后从pWebBrowser2获取document
CComPtr<IDispatch> spHTMLDocumentDispath;
hr = pWebBrowser2->get_Document(&spHTMLDocumentDispath);
CComQIPtr<IHTMLDocument2> spHTMLDocument = spHTMLDocumentDispath;
//从spHTMLDocument 中拿body
IHTMLElementPtr spBody = NULL ;
HRESULT hr = pdc->get_body(&spBody);
//用spBody 的get_innerHTML就可以取到frame对应的html代码了
_bstr_t bstrBody;
HRESULT hr = spBody->get_innerHTML(bstrBody.GetAddress());