- 博客(24)
- 收藏
- 关注
原创 Scala学习总结③
特质叠加 由于一个类可以混入(mixin)多个 trait,且 trait 中可以有具体的属性和方法,若混入的特质中具有相同的方法(方法名,参数列表,返回值均相同),必然会出现继承冲突问题。2、一个类(Sub)混入的两个 trait(TraitA,TraitB)中具有相同的具体方法,且两个 trait 继承自相同的 trait(TraitC),及所谓的“钻石问题”,解决这类冲突问题,Scala 采用了特质叠加的策略。2. 单例对象对应的类称之为伴生类,伴生对象的名称应该和伴生类名一致。
2025-04-03 11:11:24
210
原创 Scala学习总结②
Scala 有两种包的管理风格,一种方式和 Java 的包管理风格相同,每个源文件一个包(包名和源文件所在路径不要求必须一致),包名用“.”进行分隔以表示包的层级关系,如com.zpark.scala。在 Scala 中可以为每个包定义一个同名的包对象,定义在包对象中的成员,作为其对应包下所有 class 和 object 的共享变量,可以被直接访问。1. 若使用 Java 的包管理风格,则包对象一般定义在其对应包下的 package.scala文件中,包对象名与包名保持一致。1. 区分相同名字的类。
2025-04-02 16:21:47
602
原创 Scala学习总结①
2. 字母、、数字、下划线、美元$符号(最好不要用$为开头)、可以使用一个或者多个符号(+ ++ :::等)2. 每个单词的首字母应该大写(这样的作用应该是更容易阅读)优雅(这里我理解为观赏性好,好看)、速度快。多行注释:/* 单行注释://1. 两种形式:(字符数字和符号)3. 文件名的后面要记得加扩展名。1. package #{内容}使用import关键字(用来导入包)6. 与Java互操作性。1. 面向对象特性。1. 交互式编程。
2025-03-27 10:42:02
511
原创 图片识别技术与应用学习总结①⑧
现在来看 , 很多视觉任务都可以套用这招。 起初是做医学方向 , 现在也是。损失由多个位置计算 , 再更新。 简单但是很实用 ,应用广。也是很常见的事 , 多输出。概述就是编码解码过程。
2025-03-21 09:59:31
558
原创 图像识别技术与应用学习总结①⑦
1. VOC数据集:PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。2. 实例分割:只预测前景目标的类别属性以及边框,个体ID,每一个像素可以属于多个ID。3. COCO数据集:以场景理解为目标,特别选取比较复杂的日常场景。将不同的像素划分到不同的类别,非常细粒度的分类。人像抠图,医学组织提取,遥感图像分析,自动驾驶,材料图像等。事物Stuff:不可数背景(天空,草地,路面)。· IoU:前景目标交并比。
2025-03-20 10:07:50
570
原创 图像识别技术与应用①⑥
1. 亲民政策 , 单GPU就能训练的非常好 , 接下来很多小模块都是这个出发点。2. 数据增强: 调整亮度、 对比度、 色调、 随机缩放、 剪切、 翻转、 旋转。DropBlock:之前的dropout是随机选择点(b) , 现在吃掉一个区域。1. Random Erase: 用随机值或训练集的平均像素值替换图像的区域。1. 只增加训练成本 , 但是能显著提高精度 , 并不影响推理速度。3. 消融实验 , 感觉能做的都让他给做了 ,这工作量不轻。2. 两大核心方法 ,从数据层面和网络设计层面来进行改善。
2025-03-14 10:26:48
660
原创 图像识别技术与应用学习总结①⑤
左图:对不同的特征图分别利用;右图:不同的特征图融合后进行预测; 左图:图像金字塔;今日学习总结完毕(=^▽^=)
2025-03-13 09:44:51
522
原创 图像识别技术与应用学习总结①④
每个Cell只预测一个类别,如果重叠无法解决。小物体检测效果一般,长宽比可选的但单一。今日份学习总结完毕(*^ω^*)YOLO-V2-聚类提取先验框。YOLO-V2-更大的分辨率。YOLO-V2-网络结构。
2025-03-12 16:45:21
704
原创 图像识别技术与应用学习总结①③
PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。(Xmin, Ymin, W, H),其中x,y,w,h均不是归一化后的数值,分别代表左上角坐标和宽、高。(Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。起源于微软2014年出资标注的MS COCO数据库。识别图片中有哪些物体并且找到物体的存在位置。首先过滤掉低类别置信度的检测结果。x,y,w,h均为归一化结果。生成的预测结果会非常多。
2025-03-11 10:35:18
623
原创 最近学习感悟总结
通过对图像识别技术与应用的学习,我不仅掌握了相关的理论知识和技术方法,还深刻认识到其在推动各行业发展和改善人们生活方面的巨大潜力。在未来的学习和工作中,我将继续深入研究图像识别技术,不断探索其新的应用领域和创新方法,为解决实际问题贡献自己的力量。机器学习的学习让我认识到它强大的实用性与发展潜力,在未来,我会持续关注新技术,深入研究,提升自己利用机器学习解决复杂问题的能力。将不同的图像,划分到不同的类别标签,实现最小的分类误差。(先导入需要的模块;再定义相关模型结构;(模型集成方法采用类似投票机制的方法)
2025-03-10 17:26:45
438
原创 机器学习学习总结②
利用神经网络完成对手写数字进行识别的实例,来说明如何借助nn工具箱来实现一个神经网络,并对神经网络有个直观了解。在这个基础上,后续我们将对nn的各模块进行详细介绍。实例环境使用PyTorch1.5+,GPU或CPU,源数据集为MNIST。利用torchvision对数据进行预处理,调用torch.utils建立一个数据迭代器。利用PyTorch内置函数mnist下载数据。实例化模型,并定义损失函数及优化器。利用nn工具箱构建神经网络模型。今日的学习总结完毕(*^ω^*)
2025-03-06 11:17:29
543
原创 机器学习学习总结①
导入数据,这里数据已下载本地,故设download=False。#定义相关模型结构,这三个网络结构比较接近。今日份学习总结完毕啦🥰。
2025-03-05 17:12:12
418
原创 图像识别技术与应用学习总结①②
将图像拼接成网格形式显示将图像和标签移动,并使用训练好的模型对图像进行预测, 输出显示预测类别为“frog”、“dog”、“deer”和“horse”一个linear全连接层。输出总数量, 输出损失值 损失值逐渐降低,使用了钩子函数,像keras一样显示各层参数。计算准确率 准确率是百分之六十六, 计算每个类的准确率。今日份学习总结已完毕~(=^▽^=)加载测试数据集并显示部分图像的标签。
2025-03-04 11:31:53
261
原创 图像识别技术与应用学习总结①①
数据集分为5个训练批次和1个测试批次,每个批次有10000个图像。图6-27显示了数据集中涉及的10个类,以及来自每个类的10个随机图像。为方便起见,我们已预先下载好数据并解压,存放在当前目录的data目录下,所以,参数download=False。CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。以下是使用PyTorch实现CIFAR-10多分类任务的示例代码,CIFAR-10数据集包含10个不同类别的图像,如飞机、汽车、鸟类等。
2025-03-03 17:16:38
455
原创 图像识别技术与应用学习总结⑩
可以用来表示模型的精度,即模型识别正确的个数/样本的总个数。多类别分类模型各个类别之间的分类情况对于k分类问题,混淆矩阵为k*k的矩阵,元素Cij表示第i类样本被分类器判定为第j类的数量。准确率(Precision):又称为查准率,表示在模型识别为正类的样本中,真正为正类的样本所占的比例。召回率(Recall):又称为查全率,表示模型正确识别出为正类的样本的数量占总的正类样本数量的比值。将不同的图像,划分到不同的类别标签,实现最小的分类误差。迁移学习:使用预训练模型。
2025-02-28 11:24:19
531
原创 图像识别技术与应用学习总结⑨
cd到logs目录所在的同级目录,在命令行输入如下命令,logdir等式右边可以是相对路径或绝对路径。如果要对数据集进行多个操作,可通过Compose将这些操作像管道一样拼接起来,类似于nn.Sequential。transforms提供了对PIL Image对象和Tensor对象的常用操作。transforms提供了对PIL lmage对象和Tensor对象的常用操作。1)对PIL Image的常见操作如下。2)对Tensor的常见操作如下。其中,xxx指的是各种可视化方法。总结完毕(=^▽^=)
2025-02-27 11:45:58
434
原创 图像识别技术与应用学习总结⑥
nn.functional中的函数,写法一般为nn.funtional.xxx,如nn.funtional.linear、nn.funtional.conv2d、nn.funtional.cross_entropy等。而nn.functional.xxx需要你自己定义weight、bias,每次调用的时候都需要手动传入weight、bias等参数, 不利于代码复用。nn.Module,写法一般为nn.Xxx,如nn.Linear、nn.Conv2d、nn.CrossEntropyLoss等。
2025-02-24 16:45:42
658
原创 图像识别技术与应用学习总结⑤
通过构建具有一定“深度”的模型,可以让模型来自动学习好的特征表示(从底层特征,到中层特征,再到高层特征),从而最终提升预测或识别的准确性。AlexNet由⼋层组成:五个卷积层、两个全连接隐藏层和一个全连接输出层。表示学习:如果有一种算法可以自动地学习出有效的特征,并提高最终机器学习模型的性能,那么这种学习就可以叫作表示学习。AlexNet的架构与LeNet相似,但使⽤了更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。此外,还有5个最大池化层分布在不同的卷积层之下。3x3 卷积(更多)
2025-02-21 10:18:56
926
原创 图像识别技术与应用学习总结④
卷积神经网络(CNN)是一种用于图像识别和处理的人工神经网络,其灵感来自于动物视觉皮层的生物过程。不管检测对象出现在图像中的哪个位置,神经网络的前面几层都应该对相同的图像区域具有相似的反应。神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔较远的区域的关系。例:高度3 宽度2 的步幅填充和步幅可以改变输出的高度和宽度。步幅是每次滑动核窗口时的行/列的步长,可以成倍的减少输出形状。填充在输入周围添加额外的行/列,增加输出的高度和宽度。每个通道都有一个卷积核,结果是所有通道卷积结果的和。
2025-02-20 10:57:22
345
原创 图像识别技术与应用学习总结③
刚才登场的h(x)函数会将输入信号的总和转换为输出信号,这种函数一般称为激活函数(activation function)。当学习器把训练样本学得"太好"了的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质。(3) 激活函数的导函数的值域要在一个合适的区间内,不能太大也不能太小,否则会影响训练的效率和稳定性。如“激活”一词所示,激活函数的作用在于决定如何来激活输入信号的总和。感知机的局限性:感知机的局限性就是只能表示由一条直线分割的空间。(将输入投影到(0,1),是一个软的。
2025-02-19 17:48:23
541
原创 图像识别技术与应用学习总结②
在每个特定时间点,智能体从环境接收一些观察,并且必须选择一个动作,然后通过某种机制(有时称为执行器)将其传输回环境,最后智能体从环境中获得奖励。学习预测不相互排斥的类别的问题称为多标签分类 (multi-label classification)一个样本(一个图片或者一个候选框)中含有多个物体,标注的label也是多个的,多个类间并不是互斥的,多选多比如:多目标检测、短视频分类。推荐系统千人千面,如果面对不同的人推荐相同的东西,那这个推荐系统也许做的不是很成功。分类是训练一个分类器来输出预测的类别。
2025-02-18 11:29:49
555
原创 图像识别技术与应用学习总结
过拟合指的是模型在训练数据上表现得很好,但在未见过的测试数据上表现较差的现象。机器学习可以从经验中学习技术,并且会积累更多的经验,性能也会逐步提高,所以当机器接受一定程度的内容后,自身的经验积累到了一定程度。过拟合通常发生在模型的复杂度过高时,它可能具有过多的参数,以至于可以记住训练数据的每一个细节。欠拟合通常发生在模型复杂度不足的情况下,可能是因为模型过于简单,没有足够的表达能力来捕捉数据的真实分布。提供更多的训练数据,可以帮助模型学到更一般化的规律,减少对训练数据中噪声的过度拟合。
2025-02-17 17:31:55
1010
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人