java爬取http类型的网站比较容易实现,因为不需要建立证书的通道,直接通过httpclient访问链接获取相应源码就可以获取相关数据,现在我们可以通过证书的方式,实现java爬取https网站的相关数据。
1.下载网站的证书
以优快云博客为例 谷歌浏览器右键网页——点击检查——点击security出现如下界面
点击view certificate
点击证书路径 我们可以发现证书如下:
想要导出证书 需要IE浏览器得支持 我们使用IE浏览器重新访问该网站
点击工具——Internet选项