python统计文件中每个单词出现的次数_python统计文本中每个单词出现的次数

这篇博客介绍了如何使用Python进行文本处理,包括统计文件中每个单词的出现次数,使用collections.Counter实现。此外,还展示了如何生成序列化字符串,遍历Excel表格中的所有数据,并将Excel数据整理成Lua格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

.python统计文本中每个单词出现的次数:

#coding=utf-8

__author__ = ‘zcg‘

import collections

import os

with open(‘abc.txt‘) as file1:#打开文本文件

str1=file1.read().split(‘ ‘)#将文章按照空格划分开

print "原文本:\n %s"% str1

print "\n各单词出现的次数:\n %s" % collections.Counter(str1)

print collections.Counter(str1)[‘a‘]#以字典的形式存储,每个字符对应的键值就是在文本中出现的次数

2.python编写生成序列化:

__author__ = ‘zcg‘

#endcoding utf-8

import string,random

field=string.letters+string.digits

def getRandom():

return "".join(random.sample(field,4))

def concatenate(group):

return "-".join([getRandom() for i in range(group)])

def generate(n):

return [concatenate(4) for i in range(n)]

if __name__ ==‘__main__‘:

print generate(10)

3.遍历excel表格中的所有数据:

__author__ = ‘Administrator‘

import xlrd

workbook = xlrd.open_workbook(‘config.xlsx‘)

print "There are {} sheets in the workbook".format(workbook.nsheets)

for booksheet in workbook.sheets():

for col in xrange(booksheet.ncols):

for row in xrange(booksheet.nrows):

value=booksheet.cell(row,col).value

print value

其中xlrd需要百度下载导入这个模块到python中

4.将表格中的数据整理成lua类型的一个格式

#coding=utf-8

__author__ = ‘zcg‘

#2017 9/26

import xlrd

fileOutput = open(‘Configs.lua‘,‘w‘)

writeData="[email protected]:zcg\n\n\n"

workbook = xlrd.open_workbook(‘config.xlsx‘)

print "There are {} sheets in the workbook".format(workbook.nsheets)

for booksheet in workbook.sheets():

writeData = writeData+‘AT‘ +booksheet.name+‘ ={\n‘

for col in xrange(booksheet.ncols):

for row in xrange(booksheet.nrows):

value = booksheet.cell(row,col).value

if row ==0:

writeData = writeData+‘\t‘+‘["‘+value+‘"]‘+‘=‘+‘{‘

else:

writeData=writeData+‘"‘+str(booksheet.cell(row,col).value)+‘", ‘

else:

writeData=writeData+‘},\n‘

else:

writeData=writeData+‘}\n\n‘

else :

fileOutput.write(writeData)

fileOutput.close()

原文:http://www.cnblogs.com/pyxiaomangshe/p/7735359.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值