python中字符编码_Python中的字符编码

本文讲解了Python中字符编码的工作原理,介绍了计算机如何通过字符编码将人类文字转换为数字,重点阐述了unicode和UTF-8的角色,以及为何UTF-8在处理多语言时更受欢迎。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python中的字符编码

Python解释器执行py文件的原理

Python解释器启动后,相当于启动了一个文本编辑器,读取文件中的内容到内存中。但与文本编辑器不同的是,Python解释器的目的不是为了显示文件内容,而是一条一条执行文件中的内容

什么是字符编码

计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以,人类文字和计算机文字之间需要通过某以规则进行转换,这就是字符编码的作用。

字符编码就相当于一本密码本一样。没有密码本,人类是无法把计算机的数字0和1转换成其可以读懂的文字。

各个国家的文字不一样,所以会有不一样的“密码本”。如果用错“密码本”来解码,那么,就会出现“乱码”现象

unicode和utf-8

unicode——兼容万国的编码,即“超级密码本”

UTF-8(Unicode Transformation Format-8)

简单的说,unicode是一个精通世界各国语言的大师。大师在记录时,用自己的一套专用密码本utf-8,简单、高效。

utf-8这本密码本兼容世界万国语言,但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。

注意:内存中使用的是unicode,历史遗留问题……

关键

用什么编码存(encode)就用什么编码解(decode),推荐使用utf-8

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值