深度学习在文本挖掘与信号处理中的应用
1. 文本挖掘中的深度学习应用
1.1 数据处理与情感提取
在文本挖掘部分,我们以简·奥斯汀的著名小说《傲慢与偏见》为例,详细介绍了数据整理和情感提取的步骤。
- 步骤 1 - 2 :加载所需的DSBO包和文本。
- 步骤 3 - 4 :进行单字分词和停用词去除。
- 步骤 5 - 6 :提取并可视化62章中出现频率最高的前10个单词。
- 步骤 7 - 12 :使用CJOH和OSD这两种广泛使用的词典来展示高级和细粒度的情感。CJOH词典将每个单词标记为高级二元情感(积极或消极),而OSD词典将每个单词标记为细粒度的多种情感(积极、消极、愤怒、期待、喜悦、恐惧、厌恶、信任、悲伤和惊讶)。
- 步骤 13 :使用CJOH词典中积极或消极词汇的最大出现次数进行章节级别的情感标记。在62章中,52章的积极词汇出现次数更多,10章的消极词汇出现次数更多。
以下是获取各章节单词数量的代码:
XPSEDPVOUT 1SJEF@1SFKVEJDF@DIBQUFST
HSPVQ@CZ
CPPLDIBQUFS
EQMZSTVNNBSJ[F
XPSET O
1.2 情感比例提取
通过以下步骤提取积极和消极词汇的比例:
超级会员免费看
订阅专栏 解锁全文
1214

被折叠的 条评论
为什么被折叠?



