python编码笔记

本文深入探讨了Python中字符串与Unicode编码之间的转换问题,通过实例演示了如何使用decode方法正确地将不同格式的字符串转换为Unicode对象,特别是针对GBK和UTF-8等常见编码格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

编码是最痛苦的事情,python的decode 好像原意是decode ToUnicodeFormat from original Format ,也就是说decode的作用是将str对象变成unicode对象,原来的str是original Format 编码。

这人写的不错,有时间读读 http://wklken.me/posts/2013/08/31/python-extra-coding-intro.html

C:\Users\lucifer\Desktop\collection>python
Python 2.7.6 (default, Nov 10 2013, 19:24:18) [MSC v.1500 32 bit (Intel)] on win
32
Type "help", "copyright", "credits" or "license" for more information.
>>> s="中文"
>>> sa=u"中文"
>>> type(s)
<type 'str'>
>>> type(sa)
<type 'unicode'>
>>> print s
中文
>>> print sa
中文
>>> s
'\xd6\xd0\xce\xc4'
>>> sa
u'\u4e2d\u6587'
>>> c=s.decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python27\Lib\encodings\utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd6 in position 0: invalid c
ontinuation byte
>>> c=s.decode('gbk')
>>> c
u'\u4e2d\u6587'
>>> c=s.decode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal
not in range(128)
>>> c=s.decode('ASCII')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd6 in position 0: ordinal
not in range(128)
>>> c=s.decode('GB')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
LookupError: unknown encoding: GB
>>> c=s.decode('gb')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
LookupError: unknown encoding: gb
>>> c=s.decode('gb2312')
>>> c
u'\u4e2d\u6587'
>>>
^C

学会type(a) 查看类型,就是不知道怎么在程序中输出

>>> s
'\xd6\xd0\xce\xc4'

这种类型的数据

还有,默认的编码什么鬼,我怎么看见都是ascii 的,但是好像只能通过gbk 解码,控制台的输出和程序中的输出也不一样,what the fuck.赶紧忙完正事开始看这个。

资源下载链接为: https://pan.quark.cn/s/9648a1f24758 这个HTML文件是一个专门设计的网页,适合在告白或纪念日这样的特殊时刻送给女朋友,给她带来惊喜。它通过HTML技术,将普通文字转化为富有情感和创意的表达方式,让数字媒体也能传递深情。HTML(HyperText Markup Language)是构建网页的基础语言,通过标签描述网页结构和内容,让浏览器正确展示页面。在这个特效网页中,开发者可能使用了HTML5的新特性,比如音频、视频、Canvas画布或WebGL图形,来提升视觉效果和交互体验。 原本这个文件可能是基于ASP.NET技术构建的,其扩展名是“.aspx”。ASP.NET是微软开发的一个服务器端Web应用程序框架,支持多种编程语言(如C#或VB.NET)来编写动态网页。但为了在本地直接运行,不依赖服务器,开发者将其转换为纯静态的HTML格式,只需浏览器即可打开查看。 在使用这个HTML特效页时,建议使用Internet Explorer(IE)浏览器,因为一些老的或特定的网页特效可能只在IE上表现正常,尤其是那些依赖ActiveX控件或IE特有功能的页面。不过,由于IE逐渐被淘汰,现代网页可能不再对其进行优化,因此在其他现代浏览器上运行可能会出现问题。 压缩包内的文件“yangyisen0713-7561403-biaobai(html版本)_1598430618”是经过压缩的HTML文件,可能包含图片、CSS样式表和JavaScript脚本等资源。用户需要先解压,然后在浏览器中打开HTML文件,就能看到预设的告白或纪念日特效。 这个项目展示了HTML作为动态和互动内容载体的强大能力,也提醒我们,尽管技术在进步,但有时复古的方式(如使用IE浏览器)仍能唤起怀旧之情。在准备类似的个性化礼物时,掌握基本的HTML和网页制作技巧非常
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值