14、深度学习在文本挖掘与信号处理中的应用

深度学习在文本挖掘与信号处理中的应用

1. 文本挖掘中的深度学习应用

1.1 数据处理与情感提取

在文本挖掘部分,我们以简·奥斯汀的著名小说《傲慢与偏见》为例,详细介绍了数据整理和情感提取的步骤。
- 步骤 1 - 2 :加载所需的DSBO包和文本。
- 步骤 3 - 4 :进行单字分词和停用词去除。
- 步骤 5 - 6 :提取并可视化62章中出现频率最高的前10个单词。
- 步骤 7 - 12 :使用CJOH和OSD这两种广泛使用的词典来展示高级和细粒度的情感。CJOH词典将每个单词标记为高级二元情感(积极或消极),而OSD词典将每个单词标记为细粒度的多种情感(积极、消极、愤怒、期待、喜悦、恐惧、厌恶、信任、悲伤和惊讶)。
- 步骤 13 :使用CJOH词典中积极或消极词汇的最大出现次数进行章节级别的情感标记。在62章中,52章的积极词汇出现次数更多,10章的消极词汇出现次数更多。

以下是获取各章节单词数量的代码:

XPSEDPVOUT  1SJEF@1SFKVEJDF@DIBQUFST  
HSPVQ@CZ
CPPLDIBQUFS 
EQMZSTVNNBSJ[F
XPSET  O

1.2 情感比例提取

通过以下步骤提取积极和消极词汇的比例:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值