- 博客(49)
- 收藏
- 关注
原创 Transformer学习——Vision Transformer(VIT)原理
"Linear Projection of Flattened Patches" 指的是将图像分割成小块(称为patches),然后对这些patches进行展平(flatten),最后通过线性投影(linear projection)将展平后的向量映射到一个更低维度的空间。将图像分割为固定大小的块,对每个块进行线性嵌入,添加位置编码,然后将生成的向量序列输入到标准Transformer编码器中。其作用在于:在于将图像中的局部信息提取出来,并将其转换为可以输入到Transformer模型中的形式;
2025-02-18 17:15:51
298
原创 深度学习基础小结_项目实战:手机价格预测
鲍勃开了自己的手机公司。他想与苹果、三星等大公司展开硬仗。他不知道如何估算自己公司生产的手机的价格。在这个竞争激烈的手机市场,你不能简单地假设事情。为了解决这个问题,他收集了各个公司的手机销售数据。鲍勃想找出手机的特性(例如:RAM、内存等)和售价之间的关系。但他不太擅长机器学习。所以他需要你帮他解决这个问题。在这个问题中,你不需要预测实际价格,而是要预测一个价格区间,表明价格多高。
2024-12-01 23:16:11
1331
原创 Python基础16_数据结构:队列&树
二叉树可以为空, 也就是没有结点.- 若不为空,则它是由根结点和称为其左子树TL和右子树TR的两个不相交的二叉树组成。二叉树有五种形态:注意c和d是不同的二叉树, 因为二叉树是有左右之分的.
2024-10-30 09:17:37
898
原创 概率论基础02_随机变量及其分布&多维随机变量及其分布&期望与方差(上)
随机变量是一个从样本空间(所有可能结果的集合)到实数集的函数。样本空间中的每个结果都对应于随机变量的一个值。随机变量的值可以是离散的,也可以是连续的。随机变量通常用大写字母表示,如 X、Y 或 Z。定义事件:事件可以定义为随机变量取特定值的集合。一般用{X=?}表示。概率分布:随机变量的概率分布描述了它取每个可能值的概率。这个分布可以用来计算事件的概率。在随机变量表示的事件前加上P来表示:P{X=?}或者P(X=?
2024-10-11 19:59:21
1574
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人