- 博客(7)
- 收藏
- 关注
原创 深度学习项目4:基于BART模型的文本生成任务
BART(Bidirectional and Auto-Regressive Transformers)是自然语言处理领域用于文本生成任务(如图像描述、摘要生成、机器翻译等)的深度学习模型,其设计核心是结合双向编码器和自回归解码器的Transformer架构。
2025-02-21 23:48:02
1553
2
原创 深度学习笔记:生成任务基础与Transformer架构
生成任务是自然语言处理中的一个重要方向,Seq2seq模型和Transformer架构为其提供了强大的技术支持。训练与测试过程的差异以及Beam Search策略的优化是生成任务中的关键问题。通过深入了解这些概念和技术,我们可以更好地设计和优化生成模型,以满足实际应用中的需求。encoder和decoder的输入分别是什么?decoder的第一个自注意力模块为什么有mask?transformer架构的loss来自哪里?transformer架构的测试流程和训练流程有什么不同?
2025-02-17 10:59:01
924
原创 深度学习项目3:基于 BERT的文本分类任务
这个任务是基于BERT模型构建自己的模型对酒店评论进行情感分类(如正面评价或负面评价)。包括数据处理、模型构建、模型训练、模型评估与保存四个部分。
2025-02-15 15:30:16
1423
原创 深度学习的核心任务:特征提取与无监督学习方法
今天想和大家聊聊深度学习中的一个核心任务——特征提取,以及一些常见的无监督学习方法。这些方法在处理时非常有用,能够帮助我们提取出高质量的特征,从而提升模型的性能。
2025-02-14 17:35:32
1022
原创 深度学习项目2:基于CNN 框架的图片分类任务
本项目是kaggle上面的一个食物分类任务,有11种食物,数据集包括训练集、验证集和测试集。我们将构建卷积神经网络(CNN)模型,通过卷积层、池化层和批量归一化层提取图像的特征,通过全连接层将提取到的特征映射到类别标签,并通过最高得分来确定最终的类别。
2025-02-02 21:23:07
741
原创 深度学习项目1:基于PyTorch 框架的新冠病毒感染人数预测
本项目旨在预测美国40个州第三天的新冠阳性人数。数据集包含连续三天的阳性人数及每日社会特征,如口罩佩戴和居家办公情况。数据集中第三天的阳性人数数据被遮蔽,需借助前两天数据及第三天特征进行预测。幸运的是,我们拥有完整的训练集作为参考。我们将基于PyTorch 框架构建神经网络模型,利用前两天的疫情数据和第三天的社会特征,预测第三天的阳性人数。整个项目包括数据预处理、特征选择、模型构建、训练与验证、测试与结果评估等环节。
2025-01-15 15:32:00
1127
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人