2022年T20世界杯相关网络内容情感分析与多条件下说话人验证深度学习框架研究
在当今数字化时代,社交媒体和语音技术领域的研究愈发重要。一方面,分析社交媒体上用户对特定事件的情感倾向,能让管理者洞察公众态度;另一方面,说话人验证技术在安全、识别等领域有广泛应用。本文聚焦于2022年T20世界杯期间印度新闻频道YouTube评论区的情感分析,以及多传感器、多语言和多会话条件下的说话人验证深度学习框架。
YouTube评论区情感分析
情感分析方法介绍
先前一项研究采用70%训练数据和30%测试数据的比例进行YouTube视频评论情感数据收集,取得了F1分数87%、精确度91%、召回率83%的良好结果。
数据收集
为分析2022年T20世界杯期间印度新闻频道YouTube评论区的情感,研究团队确定了相关新闻频道,包括News 18 India、India TV等九个频道。列出印度在该届世界杯中的对手国家,如巴基斯坦、荷兰等。使用网络爬虫工具Selenium,通过循环新闻频道名称和对手国家创建自定义搜索文本,如“T20 world cup 2022 India vs Pakistan ABP News”,在YouTube上搜索并收集每个搜索结果的前3个URL,共得到129个唯一视频URL。遍历视频标题,记录印度比赛的对手国家,再循环每个唯一URL,抓取每个视频的前20条评论,最终获得1150条多语言评论的数据集。
graph LR
A[确定新闻频道] --> B[列出对手国家]
B --> C[创建搜索文本]
C --&g
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



