- 博客(1)
- 收藏
- 关注
原创 对微博情绪词进行词云图分析
如果有了特征词,怎么通过其来对文本进行向量表示?如果有了向量表示,可否计算不同文本之间的距离(相似性)?1. 读取文件,用split进行分隔,并选出文本,一行视为一个文档。文档中可能会包含一些“噪声”(比如‘[’和‘]’等,可以删除)。7.(附加) 如果tuple来表示bigram,请统计所有的bigram的频率,并通过可视化观察高频的bigram。6. 对词性进行分析,观察不同词性的出现频率,并对特定词性的词进行可视化(词云)。4. 引入停用词表(上网搜索)进行停用词过滤,重新观察词频排序的结果。
2023-06-18 11:59:12
794
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅