python: 抓取免费代理ip

最新推荐文章于 2025-04-21 13:31:15 发布

转载最新推荐文章于 2025-04-21 13:31:15 发布 · 73 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://blog.51cto.com/11962757/2093799

本文介绍了一种从西刺网抓取免费代理IP的方法，并实现了代理爬虫。通过Python的requests和BeautifulSoup库获取网页数据，再利用telnetlib验证IP的有效性，最终构建了一个可用的代理IP池。

通过抓取西刺网免费代理ip实现代理爬虫：

from bs4 import BeautifulSoup
import requests
import random
import telnetlib
requests = requests.session()
ip_list = []
proxy_list = []
headers = [
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0',
     'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36'
]
headers = random.choice(headers)
headers = {'User-Agent': headers}
def get_proxy():
    url = 'http://www.xicidaili.com/nn/'
    web_data = requests.get(url, headers=headers)
    soup = BeautifulSoup(web_data.text, 'lxml')
    ips = soup.find_all('tr')
    for i in range(1, len(ips)):
        ip_info = ips[i]
        tds = ip_info.find_all('td')
        ip = tds[1].text
        port = tds[2].text
        try:
            telnetlib.Telnet(ip, port, timeout=2)
            ip_list.append(ip+":"+port)
        except:
            pass
    #print(ip_list)
    for ip in ip_list:
        proxy_list.append('http://' + ip)     
proxies = get_proxy()

proxy_ip = random.choice(proxy_list)
proxies = {'http': proxy_ip}
print(proxies)

代理IP的使用，把他传到get请求里面就可以了

requests.get(url, headers=headers, proxies=proxies)

转载于:https://blog.51cto.com/11962757/2093799

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34416754

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

用Python获取免费代理IP

aliYz的博客

11-28

1367

为什么要IP代理：当采集数据, 批量采集数据, 请求速度过快, 网站可能会把你IP封掉 IP代理换一个IP, 再去采集请求数据

python抓取免费代理IP

06-08

1. **Python抓取免费代理IP** `get_ips.py` 文件很可能是用于从网络上抓取免费代理IP的脚本。通常，这些IP可以从公开的代理服务器列表网站、API接口或者论坛等地方获取。Python中可以使用requests库进行HTTP请求，...

参与评论您还未登录，请先登录后发表或查看评论

python爬虫设置代理ip池

欢迎来到Gavin zijef的博客，请多指教

08-07

3363

在使用python爬虫的时候，经常会遇见所要爬取的网站采取了反爬取技术，高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力，所以同一个IP反复爬取同一个网页，就很可能被封，那如何解决呢？使用代理ip，设置代理ip池。以下介绍的免费获取代理ip池的方法：优点： 1.免费缺点： 1.代理ip稳定性差需要经常更换 2.爬取后ip存在很多不可用ip需要定期筛选小建议：该方...

python爬虫设置代理ip池——方法（一）

睡着的月亮

05-01

7万+

"""在使用python爬虫的时候，经常会遇见所要爬取的网站采取了反爬取技术，高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力，所以同一个IP反复爬取同一个网页，就很可能被封，那如何解决呢？使用代理ip，设置代理ip池。以下介绍的免费获取代理ip池的方法：优点：1.免费缺点：1.代理ip稳定性差需要经常更换2.爬取后ip存在很多不可用ip需要定期筛选小建议：该方法比较适合学习使用，如果做...

Python爬虫实战：利用代理IP爬取百度翻译

努力让自己发光，对的人才能迎着光而来

08-06

25万+

Python爬虫实战：利用代理IP爬取百度翻译

Python爬虫实战：利用代理IP获取电商数据

努力让自己发光，对的人才能迎着光而来

05-27

20万+

● 电商数据对于了解用户行为、优化营销策略、提高转化率等方面具有重要作用。●通过分析用户数据，企业可以找到目标用户，精准投放广告和推广活动，有效提高广告的转化率和投资回报率。●电商数据还可以用于个性化推荐、营销活动优化、供应链管理等场景，帮助企业提升用户体验和运营效率。亮数据代理IP免费试用。

Python爬虫与代理IP：高效抓取数据的实战指南

这家伙很懒，什么都没有留下

04-21

2170

通过Python爬虫与代理IP的组合，我们可以高效获取互联网上的公开信息。但技术始终是工具，合理使用才能创造价值。在享受数据便利的同时，请始终牢记：技术应该有温度，抓取需有底线。未来的智能抓取系统，将是效率与伦理的完美平衡。

Python爬虫实战：利用代理IP获取招聘网站信息

热门推荐

努力让自己发光，对的人才能迎着光而来

02-14

34万+

Python爬虫实战：利用代理IP获取招聘网站信息

python 爬取免费代理ip

bqnagus

12-27

1287

python爬取免费代理ip

Python爬虫：代理ip电商数据实战

全网粉丝10w+，优快云、稀土掘金人工智能签约作者、专家博主，华为云十佳博主，985人工智能硕士。人工智能、大模型、计算机视觉、Python 爬虫— —商务合作：https://bbs.youkuaiyun.com/topics/614347534

07-24

7万+

为什么会出现访问管理机制呢，想了一大圈，也没发现，经过他的解答，我才知道原来很多网站常用的一种方式是对单ip进行管理，如果一个ip在一定的时间内大量访问，那么就会不再返回信息，而是返回错误。代理ip的作用很大，然而选择合适的代理服务并非易事，网上关于代理ip的网站有很多，不搜不知道，一搜直接吓我一跳，网页上代理平台眼花缭乱，各种广告满天飞，根本不知道如何选择。配置完成之后，打开谷歌搜索引擎，搜索IP就可以看到当前代理后的IP地址，成功给我们匹配到英国伦敦，说明这是一个来自英国的代理IP。

Python爬虫实战：利用代理IP批量下载哔哩哔哩美女视频

努力让自己发光，对的人才能迎着光而来

06-26

16万+

Python爬虫实战：利用代理IP批量下载哔哩哔哩美女视频

尝试使用Python多线程抓取代理服务器IP地址的示例

12-24

#!/usr/bin/env python #coding:utf-8 import urllib2 import re import threading ...#抓取代理网站 targets = [] for i in xrange(1,42): target = r"http://www.proxy.com.ru/list_%d.html" % i target

Python爬虫抓取代理IP并检验可用性的实例

01-20

经常写爬虫，难免会遇到ip被目标网站屏蔽的情况，银次一个ip肯定不够用，作为节约的程序猿，能不花钱就不花钱，那就自己去找吧，这次就写了下抓取西刺代理上的ip，但是这个网站也反爬！！！至于如何应对，我觉得...

美国职业棒球大联盟历史数据SQL数据库项目-19世纪至今的棒球比赛数据球队信息球员统计127个CSV文件相互关联-用于存储查询分析美国职业棒球大联盟从19世纪至今的完整历史数据支持.zip

09-10

fpga美国职业棒球大联盟历史数据SQL数据库项目_19世纪至今的棒球比赛数据球队信息球员统计127个CSV文件相互关联_用于存储查询分析美国职业棒球大联盟从19世纪至今的完整历史数据支持.zip

pyjson5-0.9.1-1.el8.tar.gz

09-10

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

探寻数学活动经验的本质-助力学生深度学习.doc