爬虫自动更换代理

代理地址存放在quene队列或redis的list中,格式为ip:port        

建立一个更换代理的类
public class Proxy {
     public static String ip = "218.189.26.20";
     public static int port = 8080;

     public void change() {
           
           RedisUtil redisUtil = new RedisUtil();
           String poll = redisUtil.poll(" proxy");
           String[] split = poll.split(":");
           ip = split[0];
           port=Integer.parseInt(split[1]);

           System. out.println( "代理更换成功" +ip+"-------" +port);

     }
}

在httpclient中,调用上述类的静态变量

           HttpClientBuilder builder = HttpClients. custom();
           String hostname = Proxy. ip;
            int port = Proxy. port;
           
           HttpHost proxy = new HttpHost( hostnameport);
           CloseableHttpClient client = builder.setProxy( proxy).build();

当页面下载失败时,调用change方法,重新从队列中获取代理,此时还应该将下载失败的url重新放回下载队列
               if(content .contains("存在异常流量" )){
                     
                      logger.info( "代理已失效,开始换代理" );
                      Proxy proxy = new Proxy();
                      proxy.change();
                }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值