- 博客(4)
- 收藏
- 关注
原创 深度学习与自然语言处理第五次大作业
一、作业内容1.1 实验要求基于Seq2seq模型来实现文本生成的模型,输入可以为一段已知的金庸小说段落,来生成新的段落并做分析。1.2 数据集金庸小说数据集数据库地址: https://share.weiyun.com/5zGPyJX(读入文本时注意编码格式的问题)二、实验原理2.1 seq2seq模型seq2seq全称为:sequence to sequence ,是2014年被提出来的一种Encoder-Decoder结构。其中Encoder是一个RNN结构(LSTM、GRU、RNN
2021-05-28 00:07:35
3107
原创 深度学习与自然语言处理第四次大作业
一、作业内容1.实验要求2.数据库二、实验原理1.Word Embedding2.Word2vec模型三、实验过程四、实验结果与分析1.实验结果一、CBOW1.1.1.1.1.二、Skip-gram1.1.1.1.1.2.实验分析
2021-05-13 23:28:27
5256
2
原创 深度学习与自然语言处理第三次作业
深度学习与自然语言处理第三次作业一、作业内容1. 实验要求2. 数据库二、实验原理1. 主题模型(Topic Model)2. LDA模型3. SVM三、实验过程四、实验结果与分析一、作业内容1. 实验要求在给定的数据库上利用Topic Model做无监督学习,学习到主题的分布。可以在数据库中随机选定K本小说,在每本小说中随机抽出M个段落作为训练数据,并抽出N个段落作为测试,利用topic model和其他的分类器对给定的段落属于哪一本小说进行分类。 其中K至少为3.2. 数据库内容:16本金庸武
2021-04-29 23:47:57
1416
原创 深度学习与自然语言处理第一次作业——中文平均信息熵的计算
一、作业内容1. 阅读文章【腾讯文档】Entropy_of_English_PeterBrownhttps://docs.qq.com/pdf/DUUR2Z1FrYUVqU0ts2. 实验要求参考上面的文章来计算中文的平均信息熵。3. 数据库内容:16本金庸武侠小说数据库地址: https://share.weiyun.com/5zGPyJX二、实验原理1. 熵和信息熵一、熵熵,泛指某些物质系统状态的一种量度,某些物质系统状态可能出现的程度。亦被社会科学用以借喻人类社会某些状态的程
2021-04-15 20:12:34
2473
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅