41、基于人工智能的自动标题生成与学生成绩预测

基于人工智能的自动标题生成与学生成绩预测

自动标题生成模型介绍

在自动生成标题的过程中,解码时自动创建标题句子会出现一个问题,即句子中会重复出现很多单词。为了解决这个问题,我们引入了一系列相关模型。

基础模型 - Base - Seq2Seq 模型

Base - Seq2Seq 模型结合了 Seq2Seq 和注意力机制。然而,该模型自动生成的标题存在单词重复的问题。例如,对于输入文本 “I prefer the spectrum coconut oils because they are flavorless they have more potential uses”,生成的自动标题为 “Good stuff”,效果不太理想,与原文标题区别不大。

语言模型 - Smooth - Seq2Seq 模型

为了解决 Base - Seq2Seq 模型中自动生成标题的单词重复问题,我们使用了基于词级别的语言模型进行错误纠正,即 Smooth - Seq2Seq 模型。语言模型是一种能够掌握自然语言中单词序列分布显著特征的函数或算法,它允许根据前面的单词对下一个单词进行概率预测。常用的是基于 Ngram 的方法,其基于马尔可夫假设,即序列中特定单词出现的概率仅取决于前 n - 1 个单词的出现情况。
我们从额外语料库中训练语言模型,使用 LSTM 网络进行训练。训练完成后,该语言模型用于对生成的自动标题进行错误纠正。具体操作如下:
1. 检索自动标题中重复单词的索引列表。
2. 依次移除这些重复单词,使用公式 Score = P(w2|w1) + P(w3|w1w2) + … + P(wn|w1…wn - 1)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值