数字时代的趋势引领者识别与可持续消费服务探索
趋势引领者识别研究
在当今数字化的社交网络环境中,准确识别趋势引领者对于把握市场动态、洞察消费者需求至关重要。以下将详细介绍相关的研究方法和成果。
数据标注
为了最大程度减少主观偏差,研究采用了基于过去产品趋势的标注概念。具体而言,将2017 - 2018年成功发布的40款不同品牌运动鞋视为产品创新或趋势。依据罗杰斯的理论,把针对至少一款所列运动鞋最早发布帖子的前16%用户标记为趋势引领者(共263人),而较晚谈论这些产品的用户则标记为非趋势引领者(共402人)。最终,标注数据集包含665个用户账户。
特征提取
针对这665个用户账户,研究提取了四类潜在重要特征:
1. 网络相关特征 :如PageRank值。
2. 用户相关特征 :例如个人简介中的外部链接。
3. 上下文相关特征 :像最短评论时间。
4. 内容相关特征 :如发布图片的数量。
在计算这些特征时,运用了统计分析、社会网络分析和文本挖掘等方法。由于特征的值空间和类型存在差异,如数值型(平均发布图片数量)和布尔型(个人简介中是否存在外部链接),因此对数据进行了归一化处理,并基于特征值的分位数进行向量化,以确保特征处于同一向量空间。
分类
研究比较了七种常用的机器学习算法在二分类问题上的性能。由于标注数据集存在不平衡问题(趋势引领者数量远少于非趋势引领者),采用了欠采样(US)和
超级会员免费看
订阅专栏 解锁全文
594

被折叠的 条评论
为什么被折叠?



