一、今日难题
回顾基础、学习高级部分、在牛客做python的专向练习
二、新学内容
1.dict字典
1.1 dict简介
python内置了字典dict,用key-value存储,具有极快的查找速度。
引例:根据学生的姓名查找对应的分数,用list实现
# 需要使用两个list
names = ['poll', 'bob', 'milly']
scores = [100, 78, 85]
给定一个name,要查找对应的成绩,就先要在names查找对应的位置,再从scores取出对应的成绩,list越长耗时也就越长。
用dist实现,只需要使用"name"->"score"的对照表,直接根据名字查询,无论这个表有多大,查找速度都不会变慢。
dis = {
"bob": 90, "lily": 98, "hell": 99
}
print dis["bob"] #90
分析:为什么dict查找速度这么快?因为dict的实现原理和查字典是一样的。假设字典包含了1万个汉字,我们要查某一个字,一个办法是把字典从第一页往后翻,直到找到我们想要的字为止,这种方法就是在list中查找元素的方法,list越大,查找越慢。第二种方法是先在字典的索引表里(比如部首表)查这个字对应的页码,然后直接翻到该页,找到这个字。无论找哪个字,这种查找速度都非常快,不会随着字典大小的增加而变慢,dict就是第二种实现方式。
1.2 key-value
1.2.1 通过key来存入数据
dis = {
"bob": 90, "lily": 98, "hell": 99
}
dis['nancy'] = 70
print dis
#{'hell': 99, 'bob': 90, 'lily': 98, 'nancy': 70}
由于一个key只能对应一个value,所以,多次对一个key放入value,后面的值会把前面的值冲掉:
dis = {
"bob": 90, "lily": 98, "hell": 99
}
dis['nancy'] = 70
dis['nancy'] = 79
dis['nancy'] = 45
print dis
#{'hell': 99, 'bob': 90, 'lily': 98, 'nancy': 45}
如果key不存在,dict就会报错:
print dis["hua"]
"""
Traceback (most recent call last):
File "E:/Users/xxxx/dmeo1.py", line 4, in <module>
print dis["hua"]
KeyError: 'hua'
"""
1.2.2 判断key是否存在
# 通过in来判断key是否存在
dis = {
"bob": 90, "lily": 98, "hell": 99
}
print "bob" in dis #True
#通过get()方法,假设key不存在则返回None
print dis.get("mm") #None
1.2.3 删除key
删除一个key,用pop()方法,对应的value也会从dict中删除。
dis = {
"bob": 90, "lily": 98, "hell": 99
}
dis.pop("bob")
print dis
#{'hell': 99, 'lily': 98}
注意:dict内部存放的顺序和key放入的顺序是没有关系的。
1.3 dict和list的区别
- dict的插入和查找速度极快,不会随着key的增加而变慢
- dict需要占用大量的内存,内存浪费多
- list的查找和插入时间开销随着元素的增加而增加
- list占用空间下,内存浪费较少
总结:dict是用空间换时间,dict在python中几乎无处不在,正确使用dict非常重要,需要记住的是dict的key必须是不可变对象。原因:dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。
2.set集合
set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。
2.1 创建
s = set([1, 2, 3])
传入的参数[1, 2, 3]
是一个list,而显示的{1, 2, 3}
只是告诉你这个set内部有1,2,3这3个元素,显示的顺序也不表示set是有序的。
#重复元素在set中自动被过滤:
s = set([1, 2, 2, 2, 3, 3, 4, 3])
print s
# set([1, 2, 3, 4])
2.2 增加元素
通过add(key)方法可以添加元素到set中,可以重复添加,但是不会有效果:
s = set([1, 5, 2, 3, 6])
print s
# set([1, 2, 3, 5, 6])
s.add(15)
s.add(14)
s.add("set")
print s
# set([1, 2, 3, 5, 6, 14, 15, 'set'])
2.3 删除元素
可以通过remove()方法删除元素:
s.remove(2)
s.remove(5)
2.4 交集与并集操作
# set可以看成数学意义上的无序和不重复元素的集合,因此,两个set可以做数学意义上的交集、并集等操作
# 交集
s1 = set([1, 2, 3, 4, 5])
s2 = set([2, 3])
print s1 & s2 # set([2, 3])
-----
# 并集
s1 = set([1, 2, 3, 4, 5])
s2 = set([2, 3])
print s1 | s2 # set([1, 2, 3, 4, 5])
小结:set和dict的唯一区别仅在于没有存储对应的value,但是,set的原理和dict一样,所以,同样不可以放入可变对象。对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回,这样,就保证了不可变对象本身永远是不可变的。
3.多任务编程
3.1 多任务的概念
在同一时间内执行多个任务,有两种表现形式:并发和并行。
3.2 进程
进程是资源分配的最小单位,它是操作系统进行资源分配和调度运行的基本单位。通俗理解:一个正在运行的一个程序就是一个进程。例如:正在运行的qq、wechat等,它们都是一个进程。
3.3进程的创建
#1.导入进程包
import multiprocessing
# 2.通过进程类创建进程对象
process = multiprocessing.Process()
# 3.启动进程执行任务
process.start()
使用多进程实现多任务
import time
import multiprocessing
def sing():
for i in xrange(3):
print "singing.."
time.sleep(0.5)
def dance():
for i in xrange(3):
print "dancing.."
time.sleep(0.5)
if __name__ == '__main__':
sing_process = multiprocessing.Process(target=sing)
dance_process = multiprocessing.Process(target=dance)
sing_process.start()
dance_process.start()
# 输出
"""
singing..
dancing..
dancing..
singing..
singing..
dancing..
"""
3.3.1注意事项
-
元组传参一定要和参数顺序一致
-
字典方式传参时字典的key要和参数名一致
import multiprocessing import time def sing(name, num): for i in xrange(num): print("%s-sing" % name) time.sleep(0.5) def dance(num): for i in xrange(num): print("dancing..") time.sleep(0.5) if __name__ == '__main__': s1 = multiprocessing.Process(target=sing, args=('ming', 3)) d1 = multiprocessing.Process(target=dance, kwargs={"num": 5, }) s1.start() d1.start()
3.2 获取进程编号
-
获取当前进程编号
os.getpid()
-
获取当前父进程编号
os.getppid()
三、总结
python的高级部分不好学,视频和文本资料一起看更有助于我的消化理解,看视频的时候跟着码,下班时及时复习,多想为什么是这样,在脑海里形成代码运行的场景,在下次再次接触时会觉得简单很多。