自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 番茄采摘机器人

这篇论文的研究方向是桁架番茄的抓取系统。并应用常见的数据增强技术,例如HSV(色调,饱和度,值)通道的变化,随机旋转,平移和缩放,以及上下和左右翻转。这篇论文对于番茄成熟度分类系统的探索,对于番茄采摘机器人的实际运用具有指导意义,其中轻量化的CNN模型实现了很好的精度,模拟环境干扰的方法也具有泛化性,在其他计算机视觉的模型中也可以使用类似方法增强鲁棒性。利用YOLOv5 [19]架构的变体,其输出由其所有角的坐标(x1,y1,x2,y2,x3,y3,x4,y4)定义的定向边界框,提供精确的拟合效果。

2025-09-14 22:34:20 1259

原创 ros——学习笔记

pwd定位当前目录:ls查询文件:ls -A 查询文件,包括隐藏文件mkdir <+文件名,创建文件夹>cd <+文件夹名,进入文件夹>;cd .. <退回上一级目录>touch <+文件名,创建文件>rm <+文件名,删除文件>rm -R 文件夹名 <删除文件夹>sudo(提升管理员权限) apt(应用) intall(下载) <安装命令>

2025-05-27 16:19:34 361

原创 注意力机制——学习笔记

本文从transformer的核心理论,自注意力机制出发,以其为支点理解注意力机制的总体概念。在自注意力机制中,从结果导向来看。训练好的模型要实现这样一个目标:一个词向量经过训练好的模型计算之后会得到一个调整值,这个调整值对原词向量进行调整从而得到符合上下文语境的对应语义。(编码好的词向量仅包含该词的基本语义和位置信息)。

2025-05-21 10:16:28 181

原创 transformer——学习笔记

为什么要编解码?以翻译举例:计算机无法理解人类语言,所以要将纯文本转化成数字关系,再由数字关系转换成另一种对应文本。于是,标记器和独热编码就出现了,其作为一种工具,对基础的语义单元(token)进行数字化。标记器和独热编码代表了语义单元数字化的两个极端,前者把token均投射再了一维数轴上,token之间的关系仅由数值决定,而后者为每个token均分配一个维度,有多少token就有多少维,但这样每个token之间都是正交的,无法表示token之间复杂的语义联系。

2025-04-05 22:23:42 920

原创 softmax与最大熵——学习笔记

问题:sigmoid参数只能处理二分类问题,比如对某个对象的概率的计算结果是0.6,但对多个对象计算结果之和就不一定为一。所以要解决多分类问题,就要求激活函数满足以下条件:1,计算结果>=02,计算结果和为一如上图,softmax函数就解决了上述问题,用e作为底,使结果始终大于零,再用累加的方法,使所有结果之和始终为一。上述图片为softmax计算损失函数的过程。

2025-03-30 22:59:25 325

原创 卷积神经网络——学习笔记

通过上述的一系列公式,已经可以判断神经网络与理想模型的偏差,并对其进行量化了,但要对模型进行调整,就要借助梯度下降法了。

2025-03-22 19:19:55 1126 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除