Python的编码处理技术

本文介绍了Python中处理中文编码的实用技巧,包括代码中的编码设置、获取系统及文件名的默认编码方式、终端输入输出编码的获取以及编码转换的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对于中文用户,特别需要关注Python的编码技术. 列举一些常用的技巧。
  • 代码中的编码设置,应该在代码最初两行内包含:
    # -*- coding: gb18030 -*-
  • 获得/设置系统的缺省编码
    sys.getdefaultencoding()

    sys.setdefaultencoding('utf-8')
  • 获得文件系统的文件名的编码
    sys.getfilesystemencoding()
  • 获得当前终端的输入、输出编码
    sys.stdout.encoding

    sys.stdin.encoding
  • 编码转换(先转换为unicode,再转换为具体的编码),有两种方法:
    unicode('abc', 'mbcs').encode('utf-8')

    'abc'.decode('mbcs').encode('utf-8')

其他参考:

python and unicode

原文地址:
http://czug.org/blog/panjy/python-encoding/blogentry_view?month:int=1&year:int=2007
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值