- 博客(27)
- 收藏
- 关注
原创 YOLO算法原理学习
会先把图像进行分割物体的中心点在那个格子,yolo就会物体分到哪个格子对于每个格子都会进行输入参数,然后再把这些参数向量拼起来。
2025-10-12 21:42:17
209
原创 U-Net: Convolutional Networks for Biomedical Image Segmentation论文学习
语义分割是一项为图像中的每一个像素进行分类的任务。它的目标不仅是识别出图像中有哪些物体(比如人、车、树),还要精确地指出这些物体在图像中的具体位置和轮廓。识别只能选择一个比较小的区域来,分割都故意重叠,这样才能让每个区域有关联性。d细胞与细胞间的区域要比较大的损失权重,细胞大块损失权重小。假设要预测的图片因为分割缺失边缘区域,就直接镜像对称过来。蓝色是我们的输入区域,黄色是分割得到的区域。c语义分割的,前景白色,背景黑色。b人工标注的实例数据。
2025-10-12 19:41:33
176
原创 Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文学习
之前vit只能分类,检测和切割不行,transformer完全用作图片领域有两个困难:1.一张图片里面的人,车都是大大小小,同样语义的词尺寸不同 2.图像的resolution太大了,如果以像素点作单位,像素长度就太高了采用移动窗口,自注意力只在这个窗口里面算,序列长度就大大降低了。采用分层vit都是16倍下采样率,对于多尺寸特征把控就会很弱FPN目标检测,有多个卷积层,每个卷积层的感受不同,从而处理物理不同尺寸这个问题。
2025-10-12 16:57:26
158
原创 AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE论文阅读ViT学习
现在都是使用卷积或者进行很小得改变,但这种是没有必要得,可以直接transformer,资源消耗更少效果也更好。
2025-10-12 10:49:43
226
原创 知识图谱的构建
基于图的增强回答:借助图谱的互联性,为LLM提供复杂关系信息,使其能进行更复杂的关系推论。类型:LPG(适合需要高性能图分析的场景)RDF(适合需要丰富语义表达和推理的应用)知识图谱是一种语义网络,由节点(实体)和边(关系)组成,用图的方式来表示知识。实体识别和关系抽取这一步最难,需要借助机器学习。
2025-10-11 15:24:49
144
原创 Attention Is All You Need论文阅读
抛弃了原本复杂的网络循环结构,推出了一个简单的网络模型,仅仅依靠注意力机制,比以前的效果更好,原本的侧重点只是在机器翻译上。
2025-10-09 22:36:23
368
原创 PyTorch深度学习
机器学习是通过大量的数据去训练模型,必须要有机器学习的方法或者机器学习的模型深度学习的深度就是(多层)深度神经网络 ,使用的模型就是神经网络,利用仿生学构建的模型深度学习特点:1.使用多层神经网络,能够自动提取数据的多层次特征。2.适合处理非结构化数据,如图像、音频、文本等3.依赖大量数据和计算资源,训练时间较长4.模型复杂,通常被视为“黑箱”,解释性较差。
2025-10-06 19:23:38
1047
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1