
文本
六日~
这个作者很懒,什么都没留下…
展开
-
日常笔记-snownlp情感分析计算情感得分
snownlp是Python中的一类库,功能很多,这篇笔记涉及到其中的情感分析模块。snownlp文本分类功能将原始评论分为正负情感两个数据集,返回值为情绪的概率。情感评分在[0,1]之间,越接近1,情感表现越积极,越接近0,情感表现越消极。举个例子:from snownlp import SnowNLPfrom snownlp import sentiments=SnowNLP(u'这个东西真的很赞')print(s.words) #返回分词结果print(s.sentimen原创 2022-03-03 00:35:40 · 18214 阅读 · 4 评论 -
Python词频小工具,可以直接调用
1.先定义FreqWords()函数from collections import Counterimport jieba#计算词频def FreqWords(txt, n_top=None, stopwords = None): #分词 words = jieba.cut(txt) #去掉停用词 if stopwords: words = [w for w in words if w not in stopwords] #计算词频原创 2022-02-07 20:31:57 · 775 阅读 · 0 评论 -
简单能直接出图的词云图代码
需要提前安装好jieba、wordcioud模块,直接pip就可,具体代码批注如下图,随便找了段网上的文本import jiebaimport wordcloud#读取文件with open("E:\word.txt",encoding="utf-8") as f: s = f.read()print(s)jieba.add_word('知识图谱') #防止“知识图谱”被切错词ls = jieba.lcut(s) # 生成分词列表text = ' '.join(ls)原创 2021-11-17 10:21:08 · 218 阅读 · 0 评论 -
将文本的输出结果存到CSV文件
最近遇到一个问题,需要将文本数据存到csv文件中,需要解决以下两个小问题1.文本直接存到CSV中会乱码掉,主要是因为Python和csv之间encode转换之间的问题,具体代码见批注。import csvf = codecs.open("xx.csv", 'wb', "gbk") #控制乱码writer = csv.writer(f)writer.writerows((datas))f.close()2.存到CSV文件中会把每一个字都分隔开,而我想要达到的效果是CSV的每一行的.原创 2021-10-29 18:45:18 · 1520 阅读 · 0 评论