6、Python与语料库处理工具全解析

Python与语料库处理工具全解析

1. Python提取元音的操作

在Python里,我们能够借助lambda函数来提取字符串或者文件里的元音字母。以下是相关示例代码:

# 定义一个lambda函数,判断字符x是否为元音
lambda x : x in  ’aeiou’
# 将此函数应用到iliad_opening字符串,获取其中的所有元音
’’.join(filter(lambda x : x in  ’aeiou’, iliad_opening))
# 示例输出: ioeeaeoieooeeuaououeiuoeaea
# 把相同的代码应用到整个文件
’’.join(filter(lambda x: x in ’aeiou’, open(’iliad.txt’).read()))
# 运用map()函数将提取操作扩展到文件列表
map(lambda y: ’’.join(filter(lambda x: x in ’aeiou’, open(y).read())), files)
# 利用len()函数和第二个map()函数统计两个文件中的元音数量
list(map(len, map(lambda y: ’’.join(filter(lambda x: x in ’aeiou’, open(y).read())), files)))
# 示例输出: [230624, 176061]

上述代码的操作步骤如下:
1. 定义一个lambda函数,用于判断字符是否为元音。
2. 把这个函数应用到字符串或者文件内容,借助 filter() 函数筛选出元音字

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值