python3爬虫初步之urllib实战

最新推荐文章于 2025-02-23 07:13:08 发布

小恋莫小哀

最新推荐文章于 2025-02-23 07:13:08 发布

阅读量345

点赞数

分类专栏：爬虫初学文章标签： python3爬虫初学

本文链接：https://blog.youkuaiyun.com/wwq114/article/details/88045840

版权

本文介绍了Python3使用urllib模块进行网页抓取的基础操作，通过实例展示了如何访问百度首页并获取源码。在成功运行时，可以看到百度首页的HTML源码；而当网络中断时，则会出现11001错误，提示getaddrinfo failed。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

爬虫初步之urllib实战

利用urllib.request访问度娘（https://www.baidu.com/）

首先安装并配置好Python3，其次最好有个编辑器可以写代码，然后就跟着我一起开始吧。
下面就是源码以及注释：

import urllib.request # 导入urllib.request库
url = 'https://www.baidu.com/' # 声明一个字符串变量用来存放你的目标网址
response = urllib.request.urlopen(url) # 利用urllib.request的库下的urlopen方法向目标网址发送请求，并将请求