十,编码

本文深入讲解了计算机中各种编码方式的基础知识,包括二进制编码、ASCII码、GBK、Unicode和UTF-8等,探讨了它们的特点及适用场景,并介绍了在Python中如何设置编码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最基础的编码方式:二进制

  机器能够理解的编码方式只有二进制编码。

  所以一切的编程语言都要转换成二进制编码输入到cpu中执行

  8位二进制数字可以表示256个十进制数字。

  计算机中,每8位二进制数字就表示一个字节,是计算机存储的最小单位。bytes

  1024bytes = 1kb

  1024kb = 1mb

  1024mb = 1gb

  1024gb = 1tb

  pb

  eb

  zb

  yb

  bb

  等等

Ascci码:只能表示英文大小写字母、数字和一些特殊标点和图形字符。

  由于断句问题,所有的ascci码都使用8位字符进行表示。如5位二进制数字前要用3位0进行填充。

  但是不支持英文字母以外的其他字符。

 

中国自己的编码:GBK

  两个字节表示一个中文汉字,但是不能支持全部的中文汉字,只支持常用的7445

  使用16位二进制数字,也就是2个字节

 

万国码:unicode

  每个字符都是用2个字节进行存储的。(???之前不是说是4个字节么???)

 

万国码升级版:utf-8

  可以自动调整字节长度:

  原来表示ascii的字符只用1个字节就可以表示了。

  欧洲国家的文字使用2个字节表示

  中文使用3个字节表示

  

如何在python2中调节编码?

  可以在首行添加#! -*- coding:utf-8 -*- 转换成为utf-8编码

  也可以使用#! encoding:utf-8  进行转换。

  但是必须添加到首行,放在文档中不好使。

 

  

  

转载于:https://www.cnblogs.com/wanghanyao/p/10253390.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值