31、文本挖掘:关键词提取与情感分析实践

文本挖掘:关键词提取与情感分析实践

1. 实验练习概述

在文本挖掘领域,有一系列丰富的实验练习可以帮助我们深入理解和应用相关技术。以下是对这些实验练习的详细介绍。

1.1 不同领域评论的二维投影实验
  • 数据收集 :从不同领域收集新的正负评论样本,可考虑使用以下网站(2021年7月6日访问):
  • https://www.tripadvisor.com/
  • https://www.yelp.com/
  • https://www.wayfair.co.uk/
  • https://www.amazon.com/
  • https://www.consumerreports.org/cro/index.htm
  • 实验步骤 :重复之前实验中对不同领域评论进行二维投影的过程,为每对领域生成二维地图。
  • 结果比较 :将自己的结果与之前报告的结果进行比较,观察相似性和差异。根据结果判断哪些类别更容易区分,哪些更难区分。
1.2 电影评论预处理实验
  • 数据处理 :重现对1000条正负面电影评论的预处理过程,除了提取标记外,还需计算每个文档的词汇和频率计数。
  • 统计计算 :计算两个类别以及整个集合的总运行词数和总词汇量,同时计算每个类别以及整个集合的最小、最大和平均
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值