
深度学习与神经网络
文章平均质量分 63
abutu999
这个作者很懒,什么都没留下…
展开
-
【神经网络与深度学习】Transformer原理
对拆分后的语句x = [batch_size, seq_len]进行以下操作PEposisinpos/100002idmodelPEposicospos/100002idmodeldmodel通过输入部分。原创 2024-05-15 20:57:09 · 1374 阅读 · 1 评论 -
【神经网络与深度学习】Long short-term memory网络(LSTM)
hidden_size: 每一层LSTM单元的数量num_layers: RNN中LSTM的层数batch_first: True对应[batch_size, seq_len, embedding_dim]bidiectional: True对应使用双向LSTM实例化LSTM对象后,不仅要传入数据,还有传入前一次的h_0和c_0LSTM默认输出(output, (h_n, c_n))原创 2024-04-15 22:59:35 · 398 阅读 · 1 评论 -
【神经网络与深度学习】文本情感分类
AclImdb – v1 Dataset 是用于二进制情绪分类的大型电影评论数据集,其涵盖比基准数据集更多的数据,其中有 25,000 条电影评论用于训练,25,000 条用于测试,还有其他未经标记的数据可供使用。原创 2024-04-15 18:47:25 · 850 阅读 · 0 评论 -
【神经网络与深度学习】循环神经网络基础
tokenization:分词每一个词语都是token:转为单个词、转为多个词语。原创 2024-04-13 16:30:35 · 887 阅读 · 0 评论 -
【推荐系统】NCF神经协同过滤
NCF框架是本文要实现的3个模型的主体结构。首先是输入层,分别包含两个特征向量vu和vi,描述了用户u和物品i。输入仅由一个用户向量和一个物品向量构成,它们分别是以one-hot编码的二值化稀疏向量。接着是Embedding层,这是一个全连接层,用于将输入层的系数向量表示成一个稠密向量。接着用户和物品的embedding向量被送入多层神经网络架结构中,这一层叫做神经协同过滤层(Neural CF Layer),它用于将潜在特征向量映射成预测分数(Score)。原创 2024-03-17 21:21:46 · 2773 阅读 · 0 评论 -
【深度学习与神经网络】MNIST手写数字识别1
标签是(64) ,需要将其转为one-hot编码(64,10)一层全连接网络,最后使用softmax转概率值输出。使用均方误差损失函数,梯度下降优化。训练时注意最后输出(64,10)读入数据并转为tensor向量。调用模型 训练10次。原创 2024-03-16 20:04:44 · 472 阅读 · 0 评论