str.content 和 str.text的区别

requests库content与text的区别

最新推荐文章于 2024-04-16 14:10:17 发布

南淮北安

最新推荐文章于 2024-04-16 14:10:17 发布

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python 爬虫学习文章标签： str.content 和 str.text的区别 python爬虫

本文链接：https://blog.youkuaiyun.com/nanhuaibeian/article/details/89036825

58 篇文章

订阅专栏

本文介绍了Python requests库中response对象的content与text属性的区别。content返回原始的byte型数据，适用于图片、文件等二进制数据的获取；text则返回经过编码转换的Unicode字符串，适合用于处理文本数据。文章通过实例演示了两种方法的应用场景。

对requests获取的原始数据，有两种获取形式，一个是test.content,一个是test.text

二者的区别在于content返回的是byte型数据，而text返回的是Unicode数据，
也就是说text对原始数据进行的特殊的编码，而这个编码方式是基于对原始数据的猜测(响应头)

text返回的是unicode 型的数据，一般是在网页的header中定义的编码形式。
content返回的是bytes，二级制型的数据。
但是对于某些网站的中文用text可能会导致返回乱码，所以最好是使用content然后自己进行重新编码，而且如果你想要提取图片、文件，也要用到content

import requests
url = 'http://www.pocketuni.net/'
response = requests.get(url)
print (response.content)

在这里插入图片描述

import requests
url = 'http://www.pocketuni.net/'
response = requests.get(url)
print(response.text)

在这里插入图片描述
response.text（会基于爬取的网页猜测解码类型）和 response.content.decode(‘utf-8’) 效果相同

print(response.content.decode('utf-8'))