从零开始写一个IP代理池

该代码实现了一个基于Python的HTTP代理池系统,包括代理的获取、存储、过期检查和分配策略。使用PriorityQueue管理代理优先级,支持随机、轮询和LRU三种方式获取多个代理。同时,有两个线程分别负责生产新代理和监控过期代理,Flask应用提供了API接口供外部请求。

# -*- encoding: utf-8 -*-
import os
import json
from queue import PriorityQueue
import time
import random
import logging
import threading
import requests
from flask import Flask, jsonify, request

UN_USED_EXPIRED_TIME=5
PER_SIZE_PRODUCER = 10
url = "http://192.168.1.1:50000/V0/get-ip/"

class Proxy:
    def __init__(self, ip, expired_seconds, expired_time):
        self.priority = int(time.time()) + expired_seconds - UN_USED_EXPIRED_TIME
        self.ip = ip
        self.expired_time = expired_time

    def __lt__(self, other):
        return self.priority <= other.priority

    def __gt__(self, other):
        return self.priority > other.priority

    def __str__(self):
        return "Proxy(priority[%s], ip[%s], endtime[%s])" % (self.priority, self.ip, self.expired_time)

class HttpProxyPool:
    def __init__(self):
        self._pressure_ip_proxy_queue = PriorityQueue()
        self._ip_proxies = []
        self._lru_proxies = []
        self._round_robin_index = 0
        self._lock = threading.Lock()

    def put_proxies(self):
        ips = json.loads(requests.get(url % PER_SIZE_PRODUCER).text)["data"]
        for ip in ips:
            host = ip["ip"]
            port = ip["port"]
            expred_seconds = int(ip["timeout"][:ip["timeout"].find("(")])
            expired_time = ip["end_time"]
            proxy = Proxy("%s:%s" 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值