- 博客(17)
- 收藏
- 关注
原创 。。。。。
YOLOv3作为目标检测领域的里程碑式算法,在保持实时性的基础上实现了精度的大幅提升。通过13×13、26×26、52×52三个尺度的特征图协同工作,系统既能捕捉到宏观场景特征,又能抓取微观细节信息。这种跨层级的特征融合策略,使得车辆识别中小至6×6像素的车牌都能被准确检出,检测精度较前代提升12%。在医疗影像分析中,这种机制使得单个细胞可被同时标记为"病变细胞"和"分裂中期细胞",诊断准确率提升19%。其平衡精度与效率的设计哲学,为后续的YOLO系列算法奠定了技术范式,持续推动着目标检测技术的演进边界。
2025-03-13 17:18:39
179
原创 。,,,,
核心概念:是经典的one-stage方法,将检测问题转化为回归问题,通过一个CNN实现,可实时检测视频。- 网络架构:基于GoogLeNet改进,包含20层卷积层和全连接层,输入图像大小为448×448×3,输出7×7×30的张量。其中,30 = (x,y,w,h,c)×2 + 20,2表示每个网格预测2个边界框,20代表数据集中的类别数。- 优缺点:优点是速度快、方法简单;- 网络结构优化:采用DarkNet网络,输入为416×416,无FC层,进行5次降采样,通过1×1卷积节省参数。
2025-03-12 16:21:12
188
原创 ?。。。。。。
深度学习方法中,anchor box用ratio和scale描述,有anchor - base(类似滑动窗口法穷举筛选)和anchor - free(自动生成,不穷举)两类;数据集:VOC数据集含4大类20小类,VOC 2007有9963张图片、24640个目标,VOC 2012有23080张图片、54900个目标;Ground Truth格式:包括类别和边界框坐标,常见格式有YOLO(归一化的中心点坐标和宽高)、VOC(左上角和右下角坐标)、COCO(左上角坐标和宽高,非归一化)。
2025-03-11 10:18:40
382
原创 。。。。。。
从五份PPT的梳理中,可以看到一条清晰的演进脉络:**从基础数学模型的构建,到复杂网络架构的迭代,再到工具生态的完善**,每一步都凝聚着人类对智能本质的探索与工程智慧的突破。多层感知机(MLP)的引入,通过隐藏层与非线性的激活函数(如Sigmoid、ReLU),赋予模型“弯曲决策边界”的能力。PPT强调的“局部性”与“平移不变性”原则,正是CNN的核心优势: 局部感知:卷积核仅在局部区域提取特征,减少参数量的同时保留空间关联性;池化操作:通过最大池化或平均池化降维,增强模型对微小形变的鲁棒性。
2025-03-11 10:15:15
408
原创 。。。。。。
随机森林是Bagging的典型代表,具有数据和特征选择的随机性,优势明显,包括能处理高维数据、可判断特征重要性、易并行化、便于可视化等,在Python的 sklearn 库中有对应的分类和回归算法。Boosting算法及AdaBoost:Boosting从弱学习器出发,通过加权训练提升效果,AdaBoost是其典型算法,会根据分类效果调整样本权重,最终根据分类器准确性确定权重并组合成强分类器。集成算法简介:集成学习通过构建并结合多个学习器完成任务,结合策略有简单平均法、加权平均法,结果也可通过投票法产生。
2025-03-05 18:49:23
97
原创 。。。。。
...,test_batchuint8ii, ...,...iifishflowersinsectspeoplereptilestreesvehicles 1vehicles 2...
2025-03-03 17:33:34
448
原创 图像分类项目总结
为了提高模型的性能和准确性,需要深入理解图像分类的三层境界和评估指标,并合理运用迁移学习和数据增强等技术解决样本量过少的问题。图像分类技术旨在将不同的图像划分到不同的类别标签中,以实现最小的分类误差。迁移学习:使用预训练模型(如ImageNet数据集),加速模型收敛,提高模型的泛化能力。定义:模型正确识别出为正类的样本的数量占总的正类样本数量的比值。定义:模型识别为正类的样本中,真正为正类的样本所占的比例。目标:识别并分类特定的个体,如识别并分类特定的狗或猫。重要性:评估模型对正类样本的识别全面性。
2025-02-28 09:07:56
121
原创 PyTorch数据处理与可视化进阶指南
随着2025年PyTorch 2.5版本的发布,新一代工具如TorchData(高性能数据加载库)和TorchViz(轻量可视化插件)进一步降低了开发门槛。Captum库:通过梯度显著性图(如Integrated Gradients)或特征反演,可视化模型关注区域(例如图像分类中的关键像素),提升模型可解释性。自定义批处理逻辑:通过重写DataLoader的collate_fn方法,可灵活处理不同长度的序列数据(如文本或音频),或实现动态填充。
2025-02-27 13:06:06
325
原创 Pytorch数据处理与可视化工具箱探秘
transforms模块提供了丰富的数据预处理操作,无论是针对PIL Image对象的裁剪、旋转,还是针对Tensor对象的归一化、标准化,都能轻松实现。面对散落在不同目录下的图像数据,torchvision.ImageFolder如同一位得力的助手,它能够自动根据目录结构读取图像,并生成对应的标签,极大简化了图像数据集的准备工作。Pytorch的数据处理与可视化工具箱,如同一把瑞士军刀,功能全面且易于上手。无论是数据处理的新手,还是深度学习的老兵,都能从中找到适合自己的工具,助力深度学习之旅。
2025-02-26 17:25:06
261
原创 Pytorch神经网络
nn.functional:类似纯函数,适用于激活函数等,写法如nn.functional.linear,需手动定义和传入参数,不能与nn.Sequential结合,dropout操作无自动转换功能。- nn.Module:继承此类可自动提取可学习参数,适用于卷积层等,写法如nn.Linear等,能与nn.Sequential结合,自动管理参数,dropout操作可自动转换状态。训练模型:步骤包括加载预处理数据集、定义损失函数和优化方法,循环训练模型,循环测试或验证模型,最后可视化结果。
2025-02-25 13:02:14
185
原创 Pytorch神经网络
nn.functional:类似纯函数,适用于激活函数等,写法如nn.functional.linear,需手动定义和传入参数,不能与nn.Sequential结合,dropout操作无自动转换功能。- nn.Module:继承此类可自动提取可学习参数,适用于卷积层等,写法如nn.Linear等,能与nn.Sequential结合,自动管理参数,dropout操作可自动转换状态。训练模型:步骤包括加载预处理数据集、定义损失函数和优化方法,循环训练模型,循环测试或验证模型,最后可视化结果。
2025-02-24 16:31:28
179
原创 【无标题】。。。。。
下采样层:也叫池化层,例如LeNet-5的S2层,有6个14×14的特征图,每个图中的每个像素与C1特征图中的一个2×2领域相连接,不重叠,实现长和宽各减半。- 卷积层:如LeNet-5中的C1层有6个特征图,每个特征图中的每个神经元与输入的5×5卷积核权值相连,特征图大小为28×28。- 局部连接:卷积层中的神经元只与输入数据的局部区域相连,能够捕捉图像的局部特征,符合图像数据的局部相关性特点。- 输入层:通常输入为32×32大小的黑白图像。
2025-02-21 10:10:10
126
原创 卷积神经网络的发展与应用研究报告
卷积神经网络(CNN)通过**参数共享**、**局部感知**和**平移不变性**等机制,显著降低了参数量并提升了图像特征提取能力,成为图像识别的关键技术。- **参数**:核矩阵与偏移为可学习参数,核大小、填充(Padding)和步幅(Stride)为超参数。- **模块化设计**:重复堆叠“3×3卷积+2×2最大池化”块(如VGG-16含16个卷积层)。- **更窄更深**:通过小卷积核堆叠替代大核(如5×5),减少参数并增强非线性。- **卷积编码器**:2个卷积层(5×5核,Sigmoid激活)。
2025-02-20 09:37:07
416
原创 多层识别感知机
**未来方向**:轻量化模型(如MobileNet)部署到边缘设备,增强现实(AR)中的实时识别。- **组合模型的一部分**:CNN提取特征后,MLP作为分类器(如VGG网络的末端)。- **MLP的角色**:作为神经网络基础,理解深度学习原理的关键,适用于小规模或结构化数据。- **CNN主导**:卷积层、池化层自动提取特征,减少参数(权值共享、局部连接)。- **激活函数**:如ReLU、Sigmoid,引入非线性,解决复杂问题。- **组成**:输入层、隐藏层(可多层)、输出层,全连接结构。
2025-02-19 16:34:19
374
原创 线性回归和softmax回归
**模型**:形式为 \( y = \mathbf{w}^T \mathbf{x} + b \),其中 \( \mathbf{w} \) 是权重,\( b \) 是偏置。- **非典型但可能的场景**:预测图像属性(如物体尺寸、光照强度)或回归任务(如目标检测中的边界框坐标预测)。- **与神经网络的结合**:作为神经网络的最后一层,输出分类概率(如CNN+Softmax)。- **用途**:多分类问题(如手写数字识别、图像类别分类)。- **用途**:处理回归问题,预测连续值(如房价、温度)。
2025-02-18 17:26:51
383
原创 。。。。。
PyTorch是由Meta AI(Facebook)人工智能研究小组开发的一种基于Lua编写的Torch库的Python实现的深度学习库,目前被广泛应用于学术界和工业界,PyTorch在API的设计上更加简洁、优雅和易懂。因此本课程我们选择PyTorch来进行开源学习。
2025-02-17 18:36:20
110
原创 飞机大战。。
else if (i < height - 1 && canvas[i + 1][j] == bullet)//检测是否被子弹击中。if (score % 5 == 0 && Std_Speed >= 12) //分数到达一定程度后下落加快,生成加快。if (score % 5 == 0 && Std_Speed >= 6) //分数到达一定程度后下落加快,生成加快。//j的范围:[2, width - 3]if (i == y && j == x) //打印飞机。
2023-09-26 15:52:15
12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人