文本摘要、语音识别与视频分析的深度学习实践
1. 文本摘要算法实现
1.1 摘要类型概述
阅读理解是读取、处理并理解文本含义的能力。文本摘要主要有两种类型:
- 抽取式摘要 :识别重要文本并舍弃其余部分,使文章变短。但根据实现方式,可能听起来奇怪且不连贯,因为文本是从不同段落摘取的。
- 抽象式摘要 :难度大得多,要求模型更深入地理解文本和语言。
1.2 算法实现步骤
1.2.1 加载必要库
import numpy as np
import tensorflow as tf
1.2.2 加载文本数据
article_filename = 'Data/summary/"Data/sumdata/train/train.article.txt'
title_filename = 'Data/summary/"Data/sumdata/train/train.title.txt'
with open(article_filename) as article_file:
articles = article_file.readlines()
with open(title_filename) as title_file:
titles = title_file.readlines()
超级会员免费看
订阅专栏 解锁全文
9149

被折叠的 条评论
为什么被折叠?



