- 博客(5)
- 收藏
- 关注
原创 深度学习入门——初识BERT模型
对于一个rgb图片,我们知道可以将其表示为三维矩阵作为数据,但对于一个文字,我们能想到最简单最直接的表示方法就是将其表示为一个向量。应该如何表示,可以想到用独热编码,但若使用独热编码来表示文字,每个文字所以需要的维度要两万多维,且无法表示文字之间的相关性,因此我们可以通过模型来学习,经过全连接层,实现降维并增强文字相关性,通常一个文字输出的维度为768维。对于文字常见的输入像是下图,只需要输入对应的编码就可以常见的输出有:每一个文字都输出一个值,比如输出每个文字的词性;
2025-03-03 19:05:39
1468
原创 深度学习入门——基于卷积神经网络的食物分类项目
数据集有11类食物,带标签的数据有28011个不带标签的数据有6786个,验证集有3011个,测试集有3347个此次项目来自kaggle的比赛https://www.kaggle.com/datasets/zhaopang/ml2021springhw3。
2025-02-27 17:08:48
894
原创 深度学习入门——初识卷积神经网络
CNN核心思想是通过卷积操作提取局部特征,并通过多层网络结构逐步组合这些特征,最终实现分类等任务。卷积可称为一种参数共享的不全链接。
2025-02-27 01:15:07
1593
原创 深度学习入门——简单的神经网络回归项目:新冠病毒感染人数预测
该数据来自于kaggle中比赛项目:https://www.kaggle.com/competitions/ml2021spring-hw1/leaderboard?项目介绍:M国有40个州, 对这四十个州统计了连续三天的新冠阳性人数,和每天的一些社会特征,比如带口罩情况, 居家办公情况等等。现在有一批数据,该数据第三天的数据遮住了,我们就要用前两天的情况以及第三天的特征,来预测第三天的阳性人数。
2025-02-24 14:18:54
364
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅