意见领袖识别与人员分析实践
在当今数字化时代,数据的价值愈发凸显。无论是识别网络意见领袖,还是进行人员分析以辅助企业决策,数据都扮演着关键角色。下面将为大家详细介绍相关的研究方法和实践案例。
意见领袖识别实验
实验数据
本次研究的数据来源于大众点评网,这是一个典型的第三方平台,能引导用户提供在线口碑信息。数据采集借助第三方采集器“Octopus”完成。对于每条在线口碑,研究收集了用户姓名、发布时间、口碑文本和图片数量;对于每个用户,收集了用户名、好友数量、粉丝数量、互动次数、在线口碑总数、发布时间、点赞数、回复数以及发布频率。截至2017年3月30日,“Octopus”在托乐嘉商业区共收集到5658条评论数据和用户数据。原始用户数据经过以下四个步骤进行清洗:
1. 删除1239条重复数据;
2. 删除M值为零的899条数据;
3. 删除在线口碑总数不超过3条的379条数据;
4. 根据用户数据清理评论数据。
完成这些步骤后,剩余3141条数据。在数据预处理阶段,使用Excel计算时间间隔T、点赞和回复数之和DH以及好友和粉丝数之和DC。其中,DH是通过在线口碑的有用性计算得出的人工神经网络输出,DC是通过用户活跃度计算得出的输出。
情感(S)测量
使用Python语言和一些中文文本挖掘工具来测量S值,具体步骤如下:
1. 首先使用NLPIR提取关键词并进行词频统计,构建适合本研究的专用词典。根据关键词提取和词频统计结果,向词典中添加了一些特殊词汇,如“李公主卷”“棒棒哒”“麻麻”“寿喜锅”等。
2. 使用Jieba加载“posseg”组件,基于专用词典进
超级会员免费看
订阅专栏 解锁全文
755

被折叠的 条评论
为什么被折叠?



