包、各种模块
包
什么是包?
- 包是一个含有__init__.py文件的文件夹,本质就是一个模块,是用来被导入的
为何要有包?
- 包的本质就是一个文件夹,那么文件夹唯一的功能就是将文件组织起来
随着功能越写越多,我们无法将所以功能都放到一个文件中,于是我们使用模块去组织功能,而随着模块越来越多,我们就需要用文件夹将模块文件组织起来,以此来提高程序的结构性和可维护性
注意事项
-
1.关于包相关的导入语句也分为import和from … import …两种,但是无论哪种,无论在什么位置,在导入时都必须遵循一个原则:凡是在导入时带点的,点的左边都必须是一个包,否则非法。可以带有一连串的点,如item.subitem.subsubitem,但都必须遵循这个原则。但对于导入后,在使用时就没有这种限制了,点的左边可以是包,模块,函数,类(它们都可以用点的方式调用自己的属性)。
-
2、import导入文件时,产生名称空间中的名字来源于文件,import 包,产生的名称空间的名字同样来源于文件,即包下的__init__.py,导入包本质就是在导入该文件
-
3、包A和包B下有同名模块也不会冲突,如A.a与B.a来自俩个命名空间
首次导入包这种模块,发生两件事
- 1、创建模块的名称空间,运行包下的__init__.py的文件,将运行过程中产生的名字都丢入模块的名称空间中
- 2、在当前位置拿到一个名字aaa,该名字指向__init__.py的名称空间,即aaa.名字,名字是来自于__init__.py中的
包的绝对导入和相对导入
- 绝对导入:
以执行文件的sys.path为起始点开始导入,称之为绝对导入
优点: 执行文件与被导入的模块中都可以使用
缺点: 所有导入都是以sys.path为起始点,导入麻烦 - 相对导入:
参照当前所在文件的文件夹为起始开始查找,称之为相对导入
符号: .代表当前所在文件的文件加,…代表上一级文件夹,…代表上一级的上一级文件夹
优点: 导入更加简单
缺点: 只能在导入包中的模块时才能使用 - 注意:
相对导入只能用于包内部模块之间的相互导入,导入者与被导入者都必须存在于一个包内
序列化模块 pickle
序列化:
- 把不能够直接存储在文件中的数据变得可存储,这个过程就是序列化
反序列化:
- 把文件中的数据内容拿出来,恢复成原来的数据类型,这个过程就是反序列化
php:
- serialize
unserialize
在文件中存储的数据,要么是字符串,要么是字节流
python中,所有的数据类型都可以通过dumps和loads进行序列化和反序列化
错误案例 列表不能够直接塞到文件中
lst = [1,2,3]
with open("ceshi2.txt",mode="a+",encoding="utf-8") as fp:
fp.write(lst)
1.dumps 和 loads
- 引入模块:import pickle
- dumps:把任意对象序列化成一个bytes
序列化列表
lst = [1,2,3]
res = pickle.dumps(lst)
print(res)
序列化函数
def func():
print("我是func函数")
res = pickle.dumps(func)
print(res)
序列化迭代器
it = iter(range(10))
res = pickle.dumps(it)
loads 把任意bytes反序列化成原来数据
res = pickle.loads(res)
print(res, type(res))
for i in range(3):
res2 = next(res)
print(res2)
2.dump 和 load
dump:把对象序列化后写入到file-like Object(即文件对象)
dic = {"a":1,"b":2}
with open("ceshi3.txt",mode="wb") as fp:
# dump(要转换的数据,文件对象)
pickle.dump(dic,fp)
load:把file-like Object(即文件对象)中的内容拿出来,反序列化成原来数据
with open("ceshi3.txt",mode="rb") as fp:
res = pickle.load(fp)
print(res , type(res))
3.对比dumps 和 dump
dic = {"a":1,"b":2}
str_bytes = pickle.dumps(dic)
print(str_bytes)
with open("ceshi4.txt",mode="wb") as fp:
fp.write(str_bytes)
# 通过loads来取出
with open("ceshi4.txt",mode="rb") as fp:
str_bytes = fp.read()
dic = pickle.loads(str_bytes)
print(dic,type(dic))
json
-
所有的编程语言都能够识别的数据格式叫做json,是字符串
能够通过json序列化成字符串的有如下类型:(int float bool str list tuple dict None) -
pickle 序列化成字节流
-
json 序列化成字符串
1.json用法
引入模组:import json
(1) dumps 和 loads是一对 , 序列化成字符串
dic = {"name":"王振","age":30,"classroom":"python30","family":["爸爸","妈妈","哥哥","姐姐"]}
# ensure_ascii=False 不通过ascii来显示内容 sort_keys=True 对字典的键来进行排序
res =json.dumps(dic,ensure_ascii=False , sort_keys=True)
print(res , type(res))
# loads反序列化成原来的数据类型
dic = json.loads(res)
print(dic , type(dic))
(2) dump 和 load 是一对 , 针对于文件,把数据进行序列化操作
dic = {"name":"王振","age":30,"classroom":"python30","family":["爸爸","妈妈","哥哥","姐姐"]}
with open("ceshi5.json",mode="w",encoding="utf-8") as fp:
# dump(要转换的数据,文件对象)
json.dump(dic,fp,ensure_ascii=False)
# load反序列化成原来的数据类型
with open("ceshi5.json",mode="r",encoding="utf-8") as fp:
dic = json.load(fp)
print(dic, type(dic))
2.json 和 pickle 两个模块区别
json
json 可以连续dump , 不可以连续load (load是一次性拿出所有数据进行反序列化,容易出错)
可以使用loads来解决
dic1 = {"a":1,"b":2}
dic2 = {"c":3,"d":4}
with open("ceshi6.json",mode="w",encoding="utf-8") as fp:
json.dump(dic1,fp)
fp.write("\n")
json.dump(dic2,fp)
fp.write("\n")
load的弊端,一次性读取
with open("ceshi6.json",mode="r",encoding="utf-8") as fp:
dic = json.load(fp)
print(dic)
解决方式,使用loads,一行一行进行反序列化
with open("ceshi6.json",mode="r",encoding="utf-8") as fp:
#文件对象是迭代器,一次迭代一行
for i in fp:
dic = json.loads(i)
print(dic)
pickle
import pickle
"""
pickle 可以连续dump , 可以连续load
"""
dic1 = {"a":1,"b":2}
dic2 = {"c":3,"d":4}
with open("ceshi7.pkl",mode="wb") as fp:
pickle.dump(dic1,fp)
pickle.dump(dic2,fp)
方法一
with open("ceshi7.pkl",mode="rb") as fp:
dic = pickle.load(fp)
print(dic)
dic = pickle.load(fp)
print(dic)
方法二 (一次性把文件中的数据都拿出来?)
"""try .. except .. 抑制报错 如果try代码块里面有问题,就执行except中的代码"""
"""
try:
把有问题的代码放进来
except:
如果出现异常执行这个分支的代码块.
"""
try:
with open("ceshi7.pkl",mode="rb") as fp:
while True:
dic = pickle.load(fp)
print(dic)
except:
pass
总结:
json 和 pickle 两个模块的区别:
-
(1)json序列化之后的数据类型是str,所有编程语言都识别,(数据交流)
但是仅限于(int float bool)(str list tuple dict None)
json不能连续load,只能一次性拿出所有数据 -
(2)pickle序列化之后的数据类型是bytes, (存储转换)
所有数据类型都可转化,但仅限于python之间的存储传输.
pickle可以连续load,多套数据放到同一个文件中
hash
- hash是一种算法(md5\sha256\sha512等),我们为该算法传入内容,该算法会计算得到一串hash值
hash值具备以下三个特点:
1、如果传入的内容一样,并且采用hash算法也一样,那么得到个hash值一定是一样的
2、hash值的长度取决于采用的算法,与传入的文本内容的大小无关
3、hash值不可逆
import hash
# 加密
code = hash.md5('egon烧饼哈哈哈'.encode('utf-8')
code.update(',烧中之烧'.encode('utf-8') # 往后添加
# 获取加密数据
res = code.hexdigest()