在获取他人网站是如何增加获取信息的成功率

本文介绍通过设置User-Agent、referer及启用自动重定向等方法来提高Java抓取网页图片的成功率,并提供了具体的Java代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以前获取某个网站上的图片有的时候就不能正常获取,使用网页可以打开但就是不能抓取下来

总结一下几点可以增加java抓取网站信息的成功率,本人主要的是抓取图片用的。嘿嘿

1、设置User-Agent:在java中使用下面打开图片是最好设置一下参数

 

 

 

connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon;)");

2、设置referer

connection.setRequestProperty("referer", 图片所在网页或者是该网站的域名);

3、设置自动重定向:

connection.setFollowRedirects(true); 

 

为了确保抓取不会定格,最好设置

 

connection.setConnectTimeout(3000);

connection.setReadTimeout(3000);

连接和读取超时,防止程序卡在这里。

 

 

 

爱美丽女性网 www.5aml.net

爱美丽女性网 美容 彩妆 发型 护肤 服饰 情感|分享生活美学,专注女性时尚

 

 

 



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值