最近业余时间都在学习Cefsharp实现本地客户端,发现Cefsharp可以很方便的爬取一些网站的信息,于是就一些爬取过程做一下记录。
拼多多商品搜索请求过程分析
拼多多商品搜索的链接是:拼多多,我们在CefSharp发起请求时加上log打印相关的请求信息,经过分析log,发现这条有关键字的信息是在一次MimeType为json的HTTP资源请求。代码段和日志如下
protected override IResponseFilter GetResourceResponseFilter(IWebBrowser chromiumWebBrowser, IBrowser browser, IFrame frame, IRequest request, IResponse response)
{
logger.Debug(" request_url=" + request.Url + ";request_id=" + request.Identifier + ";response_MimeType=" + response.MimeType + ";response_charset=" + response.Charset + ";response_status=" + response.StatusText);
return base.GetResourceResponseFilter(chromiumWebBrowser, browser, frame, request, response);
}
2022-07-09 09:46:18.6335 DEBUG 2007

博客介绍了如何利用CefSharp在本地客户端实现网络请求,通过分析日志发现商品搜索信息存在于JSON响应中。作者重写了CefSharp的相关处理方法,包括获取资源请求处理器、资源响应过滤器和资源加载完成后的处理,以捕获和解析JSON数据。在C#中使用Newtonsoft.Json.Linq的JObject动态解析关键词对应的JSON内容。
最低0.47元/天 解锁文章
1674

被折叠的 条评论
为什么被折叠?



