- 博客(9)
- 收藏
- 关注
原创 Datawhale 2024年AI夏令营第二期NLP方向Task03实验笔记
Transformer模型由Vaswani等人在2017年提出,作为一种新的序列到序列的模型架构,它摒弃了传统的RNN和CNN结构,完全依赖于注意力机制(Attention Mechanism)。多头自注意力机制(Multi-Head Self-Attention):通过多头机制,模型能够从不同的子空间中提取特征,提高模型的表达能力。位置编码(Positional Encoding):由于Transformer不包含循环结构,位置编码用于在输入序列中注入位置信息,使模型能够识别输入序列中的相对位置关系。
2024-07-20 23:57:15
393
原创 Datawhale 2024年AI夏令营第二期NLP方向Task02
本实验旨在使用基于序列到序列(Seq2Seq)模型的神经网络技术来实现英文到中文的机器翻译。实验中使用了PyTorch框架,并结合了torchtextjieba和sacrebleu等库来进行数据处理、模型训练和评估。通过多个训练周期,模型在开发集上的表现得到了优化,并在测试集上进行了翻译任务。
2024-07-17 22:23:44
892
原创 Datawhale 2024年AI夏令营第二期NLP方向Task01
本次实验不仅让我获得了宝贵的实践经验,也激发了我对NLP领域更深层次探索的兴趣。
2024-07-12 23:05:28
394
原创 C++实现伙伴算法,操作系统内存分配算法
内容:基于内存管理的伙伴算法,实现内存块申请时的分配和释放后的回收(malloc/free),同时在回收过程中可对块进行合并。
2023-12-13 22:08:31
599
1
原创 环形石子合并问题
初始时,对于任意i,都有f[i][i]=0,因为合并一堆石子不需要花费,其他的f[i][j]=INT_MAX,因为找花费最小值用到min。初始时,对于任意i,都有fm[i][i]=0,因为合并一堆石子不需要花费,对其他fm[i][j]=0,因为需要找花费最大值用到max。因为是环形合并问题,我们可以把规模扩大为2n,转换成直线合并问题,比如【3,4,5】转换成【3,4,5,3,4,5】,再通过控制枚举区间的长度实现环形合并。其中sum[i][j]表示第i到第j个石子的重量和,即需要合并的代价。
2023-11-19 17:09:46
243
原创 解决visual studio 打开easyx时无法显示控制台问题
这个问题的原因是,当一个GUI程序(使用图形库)打开窗口时,操作系统会自动将控制台窗口最小化。这是系统的默认行为,以免屏幕上出现太多窗口。
2023-04-29 13:44:14
2125
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人