- public static String get(String uri){
- System.setProperty("https.proxySet", "true");
- System.getProperties().put("https.proxyHost", ip);
- System.getProperties().put("https.proxyPort", port);
- Document doc = null;
- String agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)"
- + " Chrome/56.0.2924.87 Safari/537.36" ;
- try {
- doc = Jsoup.connect(uri).ignoreContentType(true)
- .userAgent(agent)
- // ignoreHttpErrors
- //这个很重要 否则会报HTTP error fetching URL. Status=404
- .ignoreHttpErrors(true) //这个很重要
- .timeout(3000).get();
- } catch (IOException e) {
- System.out.println(e.getMessage()+" **************** get");
- }
- if (doc!=null) {
- return doc.body().text();
- }
- return null;
- }
使用Jsoup加代理发送get请求
最新推荐文章于 2023-09-28 11:06:16 发布
本文介绍了一个使用Java中的Jsoup库来抓取指定URL网页内容的方法。该方法设置了代理服务器,并通过模拟浏览器行为避免被目标网站拦截,同时处理了可能遇到的HTTP错误。
1303

被折叠的 条评论
为什么被折叠?



