content返回的是byte编码的response对象。
text则是根据网页的响应来猜测编码,如果服务器不指定的话,默认编码是"ISO-8859-1",返回的是unicode编码的response对象,
类似HTML或者XML的文本文件倾向于使用r.text,类似图片或者PDF文件这类二进制文件倾向于使用r.content.
You can also access the response body as bytes, for non-text requests:
>>> r.content
本文探讨了如何处理HTTP响应中不同类型的编码,详细解释了在非指定编码情况下,默认使用ISO-8859-1编码进行文本解析的方法。同时,针对不同文件类型,如文本与二进制文件,提出了使用r.text与r.content的建议。
661

被折叠的 条评论
为什么被折叠?



