1.19转换并计时数据

本文介绍了一种优雅地结合数据计算与转换的方法,即使用生成器表达式。通过实例展示了如何利用生成器表达式计算平方和,并对比了生成器表达式与创建临时列表的区别。生成器表达式在处理大量数据时更加省内存,尤其适用于min()和max()等函数,可以配合key参数实现特定需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题

​ 你需要在数据列上执行聚集函数(比如sum(),min(),max(),但是首选你需要转换或者过滤数据

解决方案

​ 一个非常优雅的方式去结合数据计算与转换就是使用一个生成器表达式参数。比如,如果你想计算平方和,可以像下面这样做:

nums=[1,2,3,4,5]
s=sum(x*x for x in nums)
print(s)

下面有跟多的列子:

import os

files = os.listdir('D:\study\workspace\python学习')
if any(name.endswith('.py') for name in files):
    print('There be python')
else:
    print('Sorry,no python.')
s = ('ACME', 50, 123, 45)
print(','.join(str(x) for x in s))
portfolio = [
    {'name': 'GOOG', 'shares': 50},
    {'name': 'YHOO', 'shares': 75},
    {'name': 'AOL', 'shares': 20},
    {'name': 'scox', 'shares': 65}]
min_shares=min(s['shares'] for s in portfolio)
print(min_shares)

讨论

​ 上面的示例向你演示了当生成器表达式作为一个单独参数传递给函数时候的巧妙语法(你并不需要加更多的括号)。比如,下面这些语句时等级的:

s=sum((x *x for x in nums)) #显示的传递一个生成器表达式对象
s=sum(x*x for x in nums)# 更加优雅的实现方式,省略了括号

​ 使用一个生成器表达式作为参数比先创建一个临时列表更加高效和优雅。比如,如果你不使用生成器表达式的话,你可能会考虑使用下面的实现方式:

nums=[1,2,3,4,5]
s=sum([x*x for x in nums])

​ 这种方式同样可以达到想要的效果,但是它会多个步骤,先创建一个额外的列表。对于小型列表可能没什么关系,但是如果元素量非常大的时候,它会创建又给巨大的仅仅被使用一次就被丢弃的临时数据结构。而生成器方案会以迭代的方式转换数据,因此更加省内存。

​ 在使用一些聚焦函数比如min()和max()的时候你可能更加倾向于使用生成器版本,他们接收到的一个key关键参数或许对你很有帮助。比如,在上面的证券例子中,你可能会考虑下面的实现版本:

min_shares=min(s['shares'] for s in portfolio)
print(min_shares)  # 20
max_shares=max(portfolio,key=lambda  s: s['shares'])
print(max_shares) # ->55
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值