关于webmagic爬取Https网站报错的解决办法

最新推荐文章于 2024-04-20 14:23:32 发布

「已注销」

最新推荐文章于 2024-04-20 14:23:32 发布

阅读量2k

点赞数

CC 4.0 BY-SA版权

分类专栏：爬虫文章标签： webmagic 爬虫

本文链接：https://blog.youkuaiyun.com/liutianshu77/article/details/95463177

针对webmagic 0.7.3版本爬取只支持TLS1.2的HTTPS网站出现错误的状况，作者提供了临时解决方案。此问题将在0.7.4版本得到修复。临时解决办法包括修改HttpClientGenerator的buildSSLConnectionSocketFactory方法，创建自定义的HttpClientDownloader并应用于Spider。已提供重新编译打包的webmagic-core-0.7.3.jar供使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目前webmagic最新版是0.7.3版本，在爬取只支持TLS1.2的https站点会报错

javax.net.ssl.SSLException: Received fatal alert: protocol_version
	at sun.security.ssl.Alerts.getSSLException(Alerts.java:208)
	at sun.security.ssl.Alerts.getSSLException(Alerts.java:154)
	at sun.security.ssl.SSLSocketImpl.recvAlert(SSLSocketImpl.java:2023)
	at sun.security.ssl.SSLSocketImpl.readRecord(SSLSocketImpl.java:1125)
	at sun.security.ssl.SSLSocketImpl