python 给定URL 如何获取其内容,并将其保存至HTML文档。

这篇博客介绍了如何使用Python的urllib包获取URL内容,处理编码问题,以及进行GET和POST请求。同时,讨论了HTTP响应头中的Content-Encoding gzip问题及解决办法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一,获取URL的内容需要用到标准库urllib包,其中的request模块。

import urllib.request
url='http://www.baidu.com'
response=urllib.request.urlopen(url)
string=response.read()
html=string.decode('utf-8')
print(html)

urllib.request.urlopen(urldata=None, [timeout, ]*cafile=Nonecapath=Nonecadefault=Falsecontext=None)

urlopen()方法返回一个<class 'http.client.HTTPResponse'>,即标准库http包里的对象,该包是一个底层包,由request模块调用。

read()方法返回一个<class 'bytes'>,字节对象是计算机认的,人看不懂。需要转成人看得懂的字符串。

字节对象转成str对象用str.decode()方法


 

二,将获取的str对象内容保存到HTML文件,需用到程序内置的方法open()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值