zxycurry-优快云博客

原创深度学习与自然语言处理第五次大作业

一、作业内容1.1 实验要求基于Seq2seq模型来实现文本生成的模型，输入可以为一段已知的金庸小说段落，来生成新的段落并做分析。1.2 数据集金庸小说数据集数据库地址： https://share.weiyun.com/5zGPyJX（读入文本时注意编码格式的问题）二、实验原理2.1 seq2seq模型seq2seq全称为：sequence to sequence ，是2014年被提出来的一种Encoder-Decoder结构。其中Encoder是一个RNN结构（LSTM、GRU、RNN

2021-05-28 00:07:35 3107

原创深度学习与自然语言处理第四次大作业

一、作业内容1.实验要求2.数据库二、实验原理1.Word Embedding2.Word2vec模型三、实验过程四、实验结果与分析1.实验结果一、CBOW1.1.1.1.1.二、Skip-gram1.1.1.1.1.2.实验分析

2021-05-13 23:28:27 5256 2

原创深度学习与自然语言处理第三次作业

深度学习与自然语言处理第三次作业一、作业内容1. 实验要求2. 数据库二、实验原理1. 主题模型（Topic Model）2. LDA模型3. SVM三、实验过程四、实验结果与分析一、作业内容1. 实验要求在给定的数据库上利用Topic Model做无监督学习，学习到主题的分布。可以在数据库中随机选定K本小说，在每本小说中随机抽出M个段落作为训练数据，并抽出N个段落作为测试，利用topic model和其他的分类器对给定的段落属于哪一本小说进行分类。其中K至少为3.2. 数据库内容：16本金庸武

2021-04-29 23:47:57 1416

原创深度学习与自然语言处理第一次作业——中文平均信息熵的计算

一、作业内容1. 阅读文章【腾讯文档】Entropy_of_English_PeterBrownhttps://docs.qq.com/pdf/DUUR2Z1FrYUVqU0ts2. 实验要求参考上面的文章来计算中文的平均信息熵。3. 数据库内容：16本金庸武侠小说数据库地址： https://share.weiyun.com/5zGPyJX二、实验原理1. 熵和信息熵一、熵熵，泛指某些物质系统状态的一种量度，某些物质系统状态可能出现的程度。亦被社会科学用以借喻人类社会某些状态的程

2021-04-15 20:12:34 2473

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 深度学习与自然语言处理第五次大作业

原创 深度学习与自然语言处理第四次大作业

原创 深度学习与自然语言处理第三次作业

原创 深度学习与自然语言处理第一次作业——中文平均信息熵的计算

空空如也

空空如也

原创深度学习与自然语言处理第五次大作业

原创深度学习与自然语言处理第四次大作业

原创深度学习与自然语言处理第三次作业

原创深度学习与自然语言处理第一次作业——中文平均信息熵的计算