UTF-8 编码格式(python)

本文深入探讨了UTF-8编码原理,由Ken Thompson于1992年创建,现已标准化为RFC3629。UTF-8用1到4个字节编码Unicode字符,适用于网页统一显示多种语言。文中还介绍了Python不同版本中UTF-8的默认使用情况,以及如何在Python 2.x中正确使用中文。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

❤️ 前段时间发现了一个 人工智能学习网站,通俗易懂,风趣幽默,分享一下给大家。👈🏻 学习链接

utf-8简介

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,由Ken Thompson于1992年创建,现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

  • 计算机中使用1-6个字节表示一个UTF-8字符;大多数汉字使用3个字节表示。
  • UTF-8是unicode编码的一种编码格式
  1. python2.x默认使用ASCII编码格式
  2. python3.x默认使用UTF-8编码格式
  • 如何在python2.x中使用中文:
    在.py脚本文件第一行增加代码:# -*- coding: utf-8 -*- 或者# coding=utf8

pycharm中创建.py脚本文件时,默认在脚本文件第一行添加# -*- coding: utf-8 -*- 或者# coding=utf8

  1. 打开pycharm;
  2. 在左上角点击file选中settings,进入设置选项;
  3. 在搜索框中输入Templates,选择File and Code Templates;
  4. 在窗口右侧选择Python Script, 在右边空白部分输入# -*- coding: utf-8 -*- 或者# coding=utf8,点击ok按钮退出设置。
  • pycharm设置编码图片详情:
    在这里插入图片描述
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值