体育文章构建与驾驶员疲劳检测技术探索
1. 体育文章构建项目概述
在体育文章构建项目中,由于手动总结耗时较长,因此设计一种为模型提供信息的格式,能在训练阶段更好地呈现内容,为最终用户生成简洁明了的文章。该项目将ROUGE指标得分从0.35提高到了0.41,并且创建了自己的数据集。
1.1 文献综述
- 自动收集体育新闻 :有研究探讨了从实时文本评论脚本中自动收集体育新闻的可能性,将其归类为一种基于句子提取的文本摘要任务,并提出了概率句子选择算法来解决局部冗余问题。
- 基于实时评论生成新闻 :尝试基于实时比赛评论生成新闻,使用了提取和抽象方法以及编码和文本增强技术。
- 板球文本评论的应用 :板球文本评论是被忽视的可靠数据源,可用于分析球员优缺点,还能构建概率机器学习模型预测球的结果。
- 模型训练与评估 :使用CNN每日邮件数据集训练模型,获得了0.38的Rouge - 1分数,该模型在生成新闻摘要方面表现出色。
- 数据摘要的深度学习架构 :探讨了指针网络、分层变压器和强化学习等深度学习架构,强调了对Seq2Seq架构和变压器网络的基本理解在自然语言处理中的重要性。
1.2 数据集的使用
为了训练和测试序列到序列模型,创建了自己的数据集。使用Python的BeautifulSoup4和requests模块进行网页抓取,从https://cr
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



