python词云示例
以2021年中央1号文件和政府工作报告文件为例,输出50个关键词。
# testPython.py
import jieba
import wordcloud
def outputWordCloud(text, outPngName):
# 配置词云对象参数
temp = wordcloud.WordCloud(width = 1000, height = 1000, font_path = "msyh.ttc", max_words = 50)
# 加载文本
temp.generate(text)
# 输出词云图片文件
temp.to_file(outPngName)
def getTextData(textName):
fd = open(textName, "r", encoding = "utf-8")
textData = fd.read()
fd.close()
return textData
def main():
tempList = [["2021年政府工作报告.txt", "2021年政府工作报告.png"], ["2021中央1号文件.txt", "2021中央1号文件.png"]]
for item in tempList: # 获取文本数据
textData = getTextData(item[0])
# 处理文本数据
textDataList = jieba.lcut(textData)
textDataListTemp = " ".join(textDataList)
# 输出词云图片
outputWordCloud(textDataListTemp, item[1])
main()


该博客通过Python的jieba和wordcloud库,展示了如何从2021年政府工作报告和中央1号文件中提取50个关键词并生成词云图片。此过程涉及文本处理和词云可视化,为信息技术领域的文本分析提供了一个实例。
3111





