本文是参考《python数据分析》的附录对生成器和文件系统结合案例的一个简单回顾。
目录
生成器
首先解释迭代器。
能以一种一致的方式对序列进行迭代(比如列表中的对象或文件中的行)是Python的一个重要特点。这是通过一种叫做迭代器协议(iterator protocol,它是一种使对象可迭代的通用方式)的方式实
现的,一个原生的使对象可迭代的方法。
some_dict = {'a': 1, 'b': 2, 'c': 3}
for key in some_dict:
print(key)
#输出:
a
c
b
迭代器是一种特殊对象,它可以在诸如for循环之类的上下文中向Python解释器输送对象。大部分能接受列表之类的对象的方法也都可以接受任何可迭代对象。比如min、max、sum等内置方法以及list、tuple等类型构造器。
dict_iterator=iter(some_dict)
print(dict_iterator)
print(list(dict_iterator))
#输出
<dictionary-keyiterator object at 0x7ff0105bea48>
['a', 'c', 'b']
生成器(generator)是构造新的可迭代对象的一种简单方式 。一般的函数执行之后只会返回单个值,而生成器则是以延迟的方式返回一个值序列,即每返回一个值之后暂停,直到下一个值被请求时再继续。要创建一个生成器,只需将函数中的return替换为yeild即可。
def squares(n=10):
print('Generating squares from 1 to {0}'.format(n ** 2))
for i in range(1,n+1):
yield i**2
gen=squares()# 注意: 调用 该生成器时,没有任何代码会被立即执行 ,print操作也并没有被执行!
print(gen) #<generator object squares at 0x7f3a75af4b40>
# 直到你从该生成器中请求元素时,它才会开始执行其代码
for x in gen:
print(x,)
输出:
<generator object squares at 0x7f3a75af4a00>
Generating squares from 1 to 100
(1,)
(4,)
(9,)
(16,)
(25,)
(36,)
(49,)
(64,)
(81,)
(100,)
另一种更简洁的构造生成器的方法是使用生成器表达式(generator expression)。这是一种类似于列表、字典、集合推导式的生成器。注意 其创建方式为,把列表推导式两端的方括号改成圆括号:
gen=(x**2 for x in range(5))
print(gen)
print(type(gen))
for i in gen:
print(i)
输出:
<generator object <genexpr> at 0x7ff01066ef00>
<type 'generator'>
0
1
4
9
16
# 和下面的 这个冗长得多的生成器是完全等价的:
def _make_gen():
for x in range(5):
yield x**2
gen=_make_gen()
for i in gen:
print(i)
yield关键字
yield关键词理解
yield 是一个类似 return 的关键字,只是这个函数返回的是个生成器,可用于迭代,但是只能读取一次,不同于迭代器。
迭代一次遇到yield时就返回yield后面(右边)的值。重点是:下一次迭代时,从上一次迭代遇到的yield后面的代码开始执行。
>>> def createGenerator() :
... mylist = range(3)
... for i in mylist :
... yield i*i
...
>>> mygenerator = createGenerator() # create a generator
>>> print(mygenerator) # mygenerator is an object!
<generator object createGenerator at 0xb7555c34>
>>> for i in mygenerator:
... print(i)
输出:
0
1
4
当调用这个函数的时候,函数内部的代码并不立马执行 ,这个函数只是返回一个生成器对象,函数内的代码什么时候执行呢?当你使用for进行迭代的时候.
关键点: 第一次迭代中你的函数会执行,从开始到达 yield 关键字,然后返回 yield 后的值作为第一次迭代的返回值. 然后,每次执行这个函数都会继续执行你在函数内部定义的那个循环的下一次,再返回那个值,直到没有可以返回的,并不像return是返回就结束后面的了。如果生成器内部没有定义 yield 关键字,那么这个生成器被认为成空的。两个例子
def count(n):
print ("cunting" )
while n > 0:
print ('before yield')
yield n # 注意:“返回”值:n . 注意此处的“返回”并不像return,就直接停止了!
n -= 1
print ('after yield' )
for i in count(5): #for中每一个遍历就是一次__next__取值
print (i)
输出:
cunting #注意先输出counting
before yield
5
after yield
before yield
4
after yield
before yield
3
after yield
before yield
2
after yield
before yield
1
after yield
上面例子中:在调用count函数时:c=count(5),并不会打印"counting"只有等到调用c.__next__()时才真正执行里面的语句。每次调用__next__()方法时,count函数会运行到语句yield n处为止,__next__()的返回值就是生成值n,再次调用__next__()方法时,
函数继续执行yield之后的语句(熟悉Java的朋友肯定知道Thread.yield()方法,作用是暂停当前线程的运行,让其他线程执行)。
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息 yield 并在下一次执行 next() 方法时从当前位置继续运行。调用一个生成器函数,返回的是一个迭代器对象。
例子2:
import sys
def fibonacci(n): # 生成器函数 - 斐波那契
a, b, counter = 0, 1, 0
while True:
if (counter > n):
return
yield a #保留了yield后面的值
a, b = b, a + b
counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成
while True:
try:
print (next(f), end=" ")
except StopIteration:
sys.exit()
输出:
0 1 1 2 3 5 8 13 21 34 55
An exception has occurred, use %tb to see the full traceback.
SystemExit
文件系统
使用内置的open函数 参数如下表:
常用的文件方法
# 用with语句可以容易地清理打开的文件,并在运行基本结束时,自动关闭文件流
with open(path) as f:
lines=[x.strip() for x in f]
鸣谢与参考:
《python数据分析》