
其他
文章平均质量分 75
如deepseekv3、transform等模型结构
YANQ662
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
6.多项式拟合原理
本文的多项式拟合原理看了博客,该博客写的很详细,这里只是作为笔记用。原创 2025-06-12 14:46:29 · 560 阅读 · 0 评论 -
5.yolov5目标检测的transfomer模型介绍(python)
trunc_normal是截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)。# 1.截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)运行结果如下:显然,该模块建立了一个3X3的tensor张量,且填充的数据符合均值为0,方差为1,最大值为2,最小值为-2的正态分布。原创 2025-03-26 17:20:26 · 940 阅读 · 0 评论 -
2.1 transformer模型原理及代码(python)
本文参考了其他一些博客,在这里作了一个汇总,参考最多的是博客、博客和博客,也看了其他博客,在这里不详细的说了,作为笔记用。原创 2025-03-16 13:06:28 · 1100 阅读 · 0 评论 -
4. designer建立关于目标检测的简单界面(python)
首先建立的界面效果如下:以上界面中,检测图1是yolov8模型检测得到的图片显示,检测图2是deeplabv3模型检测处理后得到的图片;下面检测数量是两个模型分别检测到的目标数量(图片中人的个数);右上角的相同是指两个模型的检测数量是否相同,若相同则显示"true",否则显示“false”。下面简单介绍该功能实现的步骤。原创 2025-02-22 16:17:48 · 1154 阅读 · 0 评论 -
3.1 actor基本框架(c#的Akka.Actor模式)
Actor A:完成任务后发送消息给Actor B。Actor B:接收到消息后执行自己的任务。// Actor A// 模拟任务完成// 模拟耗时操作// 通知 Actor B});// Actor B// 模拟任务完成// 模拟耗时操作});//创建 ActorSystem// 创建 Actor B// 创建 Actor A,并传入 Actor B 的引用// 触发 Actor A 开始工作。原创 2025-02-20 15:20:52 · 398 阅读 · 0 评论 -
3.actor模型的基本搭建(c#代码)
本文看了博客,这里作为笔记用,该博客内容写的很详细,这里基本上没有改动。原创 2025-02-19 17:55:44 · 387 阅读 · 0 评论 -
11.1 yolov8模型自制数据集
本文是看了博客,没有抄袭的意思,这里主要作为笔记用。原创 2025-02-18 10:28:23 · 1589 阅读 · 0 评论 -
11. yolov8的训练和测试
其实,我们就是要制作这种数据集作为训练的数据集。表示没有测到目标,这里需要作具体的修改。这就是训练用的图片。在第一个文件夹进入test文件夹如下,至此,训练和测试的大概步骤就完成了。再进入train文件夹有。进入train文件夹有。原创 2025-01-17 17:18:54 · 779 阅读 · 0 评论 -
2.基于transformer的语言模型(python)
该模型看了别人的博客,是谁的忘记了,这里只是作为笔记用(transform和注意力机制的原理后续有时间了会结合代码详细解释,在这里先上训练和预测代码)。原创 2025-02-11 14:01:36 · 166 阅读 · 0 评论 -
1.Deepseekv3论文的部分解释
1. DeepSeek-V3是一个强大的专家混合 (MoE) 语言模型,总共有 671B 个参数,每个令牌激活了 37B。2. DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,实现了高效的推理和具有成本效益的训练。3. DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,目的是最大限度地减少鼓励负载均衡对模型性能的不利影响。并设定了多标记预测训练目标以获得更强的评估基准的整体性能。原创 2025-02-07 17:32:01 · 902 阅读 · 0 评论