python 构建 ip 代理池以及简单的应用

本文介绍了在Python中创建IP代理池的原因和过程,详细讲述了如何验证代理的有效性,并提供了一个简单的应用示例——利用代理池提升博客访问量。

背景摘要

由于最近在研究爬虫相关知识,有时在频繁获取(爬取)网站数据时会出现 ip 被限制的情况导致无法及时获取想要的数据,因此想着该搞个 ip proxy pool 啦,啥也不说开始干呗。

代码实现

import re
import json
import requests
import urllib
from lxml import etree


url = 'https://raw.githubusercontent.com/fate0/proxylist/master/proxy.list'

class GetIpProxyPool(object):

    ping_url = 'https://blog.youkuaiyun.com/DanielJackZ/article/details/106870071'

    def __init__(self, url):
        self.url = url
        self.get_proxy_data()

    def get_proxy_data(self):
        result = requests.get(self.url).text
        self.store_data(result)

    def store_data(self, data):
        f = open('./res.txt', 'w+')
        f.write(data)
        f.close()

    def get_read_lines(self)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值