org.jsoup.HttpStatusException: HTTP error fetching URL. Status=403, URL=http://xxxx.com/xxx/xxx/xxx.html
设置下userAgent,伪装成浏览器就可以了
Jsoup.connect("http://xxxx.com/xxx/xxx/xxx.html").userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.64 Safari/537.31");
本文提供了一种解决JSoup爬虫在访问特定网站时遇到的HTTP 403错误的方法,即通过设置User-Agent来伪装爬虫请求,使其看起来更像常规浏览器访问。
1315

被折叠的 条评论
为什么被折叠?



