廖雪峰的python笔记（二）--入门知识(二)

最新推荐文章于 2024-03-06 12:24:36 发布

花噜噜酱

最新推荐文章于 2024-03-06 12:24:36 发布

阅读量156

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/weixin_38715903/article/details/84536461

本文深入探讨Python中的数据类型，包括整数、浮点数、字符串、布尔值及空值的概念与应用，同时解析字符串编码，如ASCII、Unicode与UTF-8的区别，以及在Python3中的处理方式。

1.数据类型、变量和常量

1).整数和浮点数在计算机内部的存储方式是不同的，

整数运算时结果是永远精确的，浮点数则会有四舍五入的误差。

python对整数的大小没有限制，浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）。

2).字符串：

'as'/"as"都可以用来表示字符串。

\ 为转义字符：

r''表示''内部的字符串默认不转义：

'''...'''的格式表示多行内容：

3).布尔值：知道and，or，not的用法就好

4).空值：None表示空值，与数字0还是有区别的，数字0有意义，None只是一个特殊的空值。

变量类型本身是不固定的：动态语言;更灵活

定义变量时必须制定变量类型：静态语言。

Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

ASCII编码和Unicode编码的区别：ASCII编码是1个字节，而Unicode编码通常是2个字节。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间

最新的Python 3版本中，字符串是以Unicode编码的，Python的字符串支持多语言；
ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符；
Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

Python对bytes类型的数据用带b前缀的单引号或双引号表示；

注意区分'ABC'和b'ABC'，前者是str，后者虽然内容显示得和前者一样，但bytes的每个字符都只占用一个字节。

ABC'.encode('ascii')
b'ABC'.decode('ascii')

'中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

要计算str包含多少个字符，可以用len()函数；len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：1个中文字符经过UTF-8编码后通常会占用3个字节，而1个英文字符只占用1个字节。

'Hello, %s' % 'world'
'Hi, %s, you have $%d.' % ('Michael', 1000000)

'Age: %s. Gender: %s' % (25, True)
//'Age: 25. Gender: True'

r = (85.0-72.0)/72.0*100
print('scores:%.2f%%' % r)
print('scores:{0:.2f}%'.format(r))