python编码utf-8 gbk小测试

本文深入探讨了Python中不同编码方式(UTF-8与GBK)对字符串处理的影响,包括长度计算、打印及编码转换的具体操作,揭示了raw_input输入依赖本地计算机编码的特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

utf-8: 

# -*- coding: utf-8 -*- #

a= raw_input(u"请输入要查询的人员的姓名input query_name: ")

b = '浙江省杭州市'

c = u'浙江省杭州市'
print len(a)
print len(b)
print len(c)
print [a]
print [b]
print [c]

输出:

请输入要查询的人员的姓名input query_name: 浙江省杭州市
12
18
6
['\xd5\xe3\xbd\xad\xca\xa1\xba\xbc\xd6\xdd\xca\xd0']
['\xe6\xb5\x99\xe6\xb1\x9f\xe7\x9c\x81\xe6\x9d\xad\xe5\xb7\x9e\xe5\xb8\x82']
[u'\u6d59\u6c5f\u7701\u676d\u5dde\u5e02']
>>> u'\u6d59'.encode('gbk')
'\xd5\xe3'
>>> print u'\u6d59'.encode('gbk')
浙
>>> u'\u6d59'.encode('utf-8')
'\xe6\xb5\x99'
>>> print u'\u6d59'.encode('utf-8')
浙
>>> print u'\u6d59'
浙
>>> print '\xe6\xb5\x99'
浙
>>> print '\xe6\xb5\x99'.decode('utf-8')
浙
>>> '\xe6\xb5\x99'.decode('utf-8')
u'\u6d59'

gbk: 

# -*- coding: gbk-*- #

a= raw_input(u"请输入要查询的人员的姓名input query_name: ")

b = '浙江省杭州市'

c = u'浙江省杭州市'
print len(a)
print len(b)
print len(c)
print [a]
print [b]
print [c]

输出:

请输入要查询的人员的姓名input query_name: 浙江省杭州市
12
12
6
['\xd5\xe3\xbd\xad\xca\xa1\xba\xbc\xd6\xdd\xca\xd0']
['\xd5\xe3\xbd\xad\xca\xa1\xba\xbc\xd6\xdd\xca\xd0']
[u'\u6d59\u6c5f\u7701\u676d\u5dde\u5e02']
>>> 

所以Python脚本最前面设置的# -*- coding: gbk   / utf-8-*-

是相对于脚本上的中文字符而言的,raw_input输入的则是根据本地计算机的编码确定.

chcp
活动的代码页: 936

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值