Python学习--urllib的使用（网络抓包的实现）

最新推荐文章于 2025-06-28 18:05:11 发布

缘如风

最新推荐文章于 2025-06-28 18:05:11 发布

阅读量2.3k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python

本文链接：https://blog.youkuaiyun.com/chyuanrufeng/article/details/79873060

Python 专栏收录该内容

17 篇文章

订阅专栏

本文介绍了一个简单的Python网络爬虫程序，演示了如何使用urllib库进行网页抓取。通过实例展示了GET和POST请求的使用，并对HTTP头部进行了设置。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

网上有很多的利用Python实现的网络爬虫程序，可以自行搜索一下。本例只是简单实现网络数据抓取没有做进一步的分析。

主要是使用urllib的使用例子。(python3)

#测试网络抓包的实现

#内置开源库 urilib , 第三方Requests , scrapy  解析库 re, BeautiulSoup

from urllib import request , parse

import urllib

#[1]

url = r'https://www.duba.com/?f=liebao'

headers = {

    'User-Agent': r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) '

                  r'Chrome/45.0.2454.85 Safari/537.36 115Browser/6.0.3',

    'Referer': r'http://www.lagou.com/zhaopin/Python/?labelWords=label',

    'Connection': 'keep-alive'

}

#设置一些http头信息

req = request.Request(url, headers=headers)

page = request.urlopen(req).read()

page = page.decode('utf-8')

print(page)

#[1]

#[2 ]

response = request.urlopen(r'http://www.baidu.com/s?wd=python')

html = response.read().decode('utf-8')

print(html)

#[2]

#如果要以POST发送一个请求，只需要把参数data以bytes形式传入

login_data = parse.urlencode([

    ('wd', "python")

])

reqt =request.urlopen(r"http://www.baidu.com/s?wd=python")

print(reqt.geturl())

html2 = reqt.read().decode('utf-8')

#print(html2)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

缘如风

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python3---urllib模块的使用，发送post&get请求&获取cookie

Alien-Hu

07-01

1万+

urllib的来源介绍在Python2版本中，有urllib和urlib2两个库可以用来实现request的发送。而在Python3中，已经不存在urllib2这个库了，统一为urllib。Python3 urllib库官方链接 https://docs.python.org/3/library/urllib.html urllib的包含的模块 urllib中包括了四个模块，包括： ...

python百度翻译urllib_python爬虫入门--用urllib实现百度翻译-Go语言中文社区

weixin_29557457的博客

02-10

328

前言上一篇内容，已经学会了使用简单的语句对网页进行抓取。接下来，详细看下urlopen的两个重要参数url和data，学习如何发送数据data。我们想做一个百度翻译就需要向百度翻译的服务器发送我们想要翻译的内容。上一篇我们说过 urllib有几个默认的参数，出了几个默认的参数外出了url 这次我需要用到一个dataurllib.request.urlopen(url, data=None, [t...

参与评论您还未登录，请先登录后发表或查看评论

Python实现抓取访问特定URL的数据包

gdfhhj的博客

11-13

1187

Python实现抓取访问特定URL的数据包

Scapy：用Python编写自己的网络抓包工具

baimaozi008的博客

05-26

6394

Scapy 是一个用来解析底层网络数据包的Python模块和交互式程序，该程序对底层包处理进行了抽象打包，使得对网络数据包的处理非常简便。该类库可以在在网络安全领域有非常广泛用例，可用于漏洞利用开发、数据泄露、网络监听、入侵检测和流量的分析捕获的。Scapy与数据可视化和报告生成集成，可以方便展示起结果和数据。Scapy的基本理念是提出一个基于领域特定语言，从而轻松快速地进行有线格式（Wire Format）管理。

使用python实现抓包分析

热门推荐

weixin_45939263的博客

12-11

1万+

只捕获源地址为192.168.1.125且目的端口为80的流量：src host 192.168.1.125 && dst port 80。prn: 定义回调函数，使用lambda表达式来写回调函数(当符合filter的流量被捕获时，就会执行回调函数)只捕获某个MAC地址主机的交互流量：ether src host 00:87:df:98:65:d8。只捕获来源于某一IP的主机流量：src host 192.168.1.125。只捕获除80端口以外的其他端口流量：!只捕获80端口的流量：port 80。

python网络抓包工具_Python 爬虫，推荐一款简单的抓包工具

weixin_39517202的博客

12-03

430

1. 前言传统的抓包工具，如：Fiddler、Charles、Wireshark、Tcpdump，相信大家都耳熟能详今天我们聊一款另外一款抓包工具：Jmeter它是 Apache 组织开发基于 JAVA 语言的免费开源测试工具虽然Jmeter 主要用于压力性能测试，但使用它进行抓包也非常方便！2. 使用步骤2-1 安装 Jmeter首先，我们在本地依次安装好 JDK 和 Jmeter，推荐使用...

Python网络爬虫（一）---urllib

qq_42366884的博客

09-03

1337

什么是网络爬虫网络爬虫英文可以叫crawler，也可以叫spider，简而言之就是利用计算机从网上抓取你所感兴趣的文件、图片、视频等。其实在大多数情况下，没有什么网络爬虫，我们也可以根据自己所需要的，通过浏览器从网上下载东西，（而网络爬虫的实质也是在模仿浏览器进行一系列的操作）但是如果我们所要的东西特别多时，例如要下载10000张图片，一个个用手去点岂不太麻烦了，所以我们需要利用到计算机来帮助我...

FNN网站m3u8视频抓取--python爬虫--抓包、浏览器模拟、openssl解密、FFmpeg视频合成、Tkinter图形界面、多线程

好好学习，天天向上

07-25

1351

注意：本程序由于要使用windows的命令行，只在windows上测试通过。如果是Linux平台，将代码中windows的命令行部分换成相应的Linux命令就行。提示：大家可以先看博客https://blog.youkuaiyun.com/liujiayu2/article/details/8608340。获取m3u8的基础知识。如果对FNN网站感兴趣，可以使用上面博文的方法对FNN网站的m3u8文件进行分析。FNN上的m3u8一般有3个。我们只需要获取主m3u8（main_m3u8），然后解析main_m3

python爬虫02-urllib使用和简版爬虫案例

weixin_39313241的博客

10-14

2396

文章目录urlliburlopen爬取http请求response 对象data 参数timeout参数RequesterrorurlparseurlencodequoteunquoteRobots 协议urllib3处理大文件设置代理设置请求头图片上传实际案例(爬取小姐姐图片)案例中遇到的问题1、无法打开控制台查看网页代码macOS python urllib3 HTTPS请求证书校验报错 urllib 在 Python 2 中，有 urllib 和 urllib2 两个库来实现请求的发送。而在 Pyt

使用Python实现windows下的抓包与解析

09-20

主要介绍了使用Python实现windows下的抓包与解析,非常不错，具有参考借鉴价值，需要的朋友可以参考下

python抓包第三方库

03-10

python抓包第三方库

python如何进行抓包

qq_65712884的博客

10-03

3874

首先导入了scapy库的所有内容。然后，定义了一个名为packet_callback的回调函数，用于处理每个抓到的数据包。在这个示例中，只是简单地打印了每个数据包的摘要信息。最后，使用sniff函数开始抓包。sniff函数接受一个prn参数，用于指定回调函数，还可以通过count参数指定抓包的数量。

利用Python开发网络抓包工具

MZ123456789的博客

08-30

3120

网络抓包是一种常用的技术手段，用于捕获和分析网络数据包。通过使用Python编程语言，我们可以开发自己的网络抓包工具，以便在网络通信中进行数据分析、安全审计和性能优化。本文将介绍如何利用Python开发一个简单而功能强大的网络抓包工具，并提供详细的步骤和示例代码。

python Pycurl 库 —— 实现对网站抓包分析

weixin_33937913的博客

08-14

446

经常使用基调网络的同学，可能对基调网络对页面元素的性能展示感觉很好。它可以做到对一条URL做详细的检测，包括：阻塞时间、DNS解析时间、建立连接时间、SSL握手时间、发出请求时间、首包时间等。其实，我们也可以做到。比如Python pycurl 库就可以做到对数据的收集，然后可以对收集的数据写入redis或者Mysql。最后前端使用echars通过图形...

如何使用python抓包，附代码

weixin_45498884的博客

08-29

5064

以下为您介绍多种使用 Python 进行抓包的方法及代码示例：使用 Scapy 库进行抓包：首先确保已经安装了 Scapy 库。如果没有安装，可以使用以下命令安装：pip install scapy。

快速实现python抓包嗅探

weixin_30906671的博客

05-20

1015

1. 使用scapy ，但是这个在macos上安装比较麻烦，没有多试 2. 使用pypcap, 这个相对上手容易 1 #coding:utf8 2 __author__ = 'yeyong' 3 import dpkt 4 import pcap 5 6 sniffer = pcap.pcap(name="en0") #name parameter => ...

Python实现微信指数批量查询教程

本文主要介绍了如何使用Python进行批量查询关键词的微信指数，涉及到了Python编程环境的搭建、网络抓包工具Fiddler的配置以及微信指数API的使用。在进行Python批量查询微信指数前，首先需要确保安装了Python开发...