第一步,把库和数据导入
import pandas as pd
data = pd.read_csv('./earphone_sentiment.csv')
data

看一下情感词
data['sentiment_word'].value_counts()

快速浏览数据集
data.info()

既然要分析情感,那么我们肯定要考虑汉字情感词之间的关系,所以我们先导入库jieba或者这个
为了数据可视化,词语太多,我们可以考虑使用词云展示,导入库worldcloud
worldcloud
导入PIL图像处理PIL
LXML解析和提取XML和HTML中的数据
imageio
接下来的代码可以在noteboook使用
!pip install jieba
from wordcloud import WordCloud
import pandas as pd
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
from lxml import etree
import imageio

本文探讨了一种情感分析方法,通过导入pandas和jieba库,首先分析了耳机电商品牌的评论情感词频率,并使用词云可视化展示词语分布。接着,通过去除停用词和生成词云,揭示了用户的喜好倾向。柱状图则对比了不同字段的频次,提供全面的数据洞察。
最低0.47元/天 解锁文章
1101

被折叠的 条评论
为什么被折叠?



