自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 Transformer笔记

Transformer模型完全基于注意力机制,没有任何卷积层或循环神经网络。之前Transformer最初应用于文本数据上的序列到序列上的学习,现在已经推广到各种现代深度学习中,例如语言、视觉、语音和强化学习领域。

2025-02-17 13:17:29 963

原创 转置卷积与全卷积网络FCN在语义分割中的应用

关键点:对一个输入而言,对其先进行卷积,再进行转置卷积,保证两次操作的超参数相同可以保证输入和输出的形状相同。

2024-11-21 14:19:54 2233 1

原创 语义分割(semantic segmentation)

语义分割指将图片中的每个像素分类到对应的类别,语义区域的标注和预测是像素级的,语义分割标注的像素级的边界框显然更加精细。

2024-11-19 21:06:39 1145

原创 目标检测(object detection)

目标检测广泛应用在多个领域:无人驾驶,机器人…那么如何去定位一个目标的位置呢?

2024-11-14 17:42:36 975

原创 计算性能+提升模型性能的关键技术

关于如何利用GPU加快模型训练,以及通过数据增广加强数据信息和利用微调来优化模型性能。

2024-11-06 16:39:21 968

原创 树叶分类竞赛(Baseline)以及kaggle的GPU使用

dataset分为init,getitem,len三部分init函数:定义照片尺寸和文件路径,根据不同模式对数据进行不同的处理。getitem函数:获取文件的函数,同样对于不同模式的请求对数据有不同的处理。

2024-11-01 09:44:20 980

原创 现代卷积神经网络(GoogLeNet+批量归一化+ResNet+DenseNet)

其中Inception块的通道数分配之比是在ImageNet数据集上通过大量的实验得来的。GoogLeNet和它的后继者们一度是ImageNet上最有效的模型之一:它以较低的计算复杂度提供了类似的测试精度。

2024-10-29 16:31:43 1946

原创 LeNet+AlexNet+VGG+NiN架构笔记

卷积神经网络(CNN)是一类使用卷积层的网络;在卷积神经网络中,组合使用卷积层、非线性激活函数和池化层为了构造高性能的卷积神经网络,通常对卷积层进行排序,逐渐降低其表示的空间分辨率,同时增加通道数在传统的卷积神经网络中,卷积块编码得到的表征在输出之前需由一个或多个全连接层进行处理LeNet是最早的卷积神经网络AlexNet的架构与LeNet相似,但使用了更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。

2024-10-25 15:36:58 1084

原创 池化层笔记

池化层返回窗口中最大或平均值缓解卷积层对位置的敏感性同样 有窗口大小、填充和步幅作为超参数池化的本质是增强泛化 避免过拟合池化层窗口的重叠与没有重叠的差别没有很大差别。

2024-10-24 11:03:24 554

原创 卷积层笔记

卷积层关键超参数:核大小,填充(一般是为了保证输入和输出大小相等),步幅(模型复杂度)

2024-10-23 20:19:20 912

原创 神经网络基础笔记

自定义模型顺序封装到函数内,最后只需要函数调用即可。 前向计算net(X)定义层之后可与其他层连着用层是块的组成部分: 块是由一个或多个层组成的。例如,一个卷积块可能包含一个卷积层、一个激活层和一个批归一化层。

2024-10-20 21:53:15 437

原创 模型的优化和评估笔记

神经网络的优点:本身是一种语言,不同layer是一部分,从多个layer来描述某件事情。丢弃法将一些输出项随机置0来控制模型复杂度常作用在多层感知机的隐藏层输出上丢弃概率是控制模型复杂度的超参数nn.ReLU()。

2024-10-18 21:49:11 1111

原创 多层感知机笔记

多层感知机

2024-10-15 21:11:30 748

原创 softmax回归+损失函数笔记

真实值的区别回归问题变为分类问题,由单输出变为多输出。

2024-10-14 22:26:26 698

原创 线性回归+基础优化算法笔记

在每次迭代中,首先随机抽样一个小批量B, 它是由固定数量的训练样本组成的。最后,将梯度乘以一个预先确定的正数η,并从当前参数的值中减掉。此刻指的是根据生成的数据来拟合模型参数,开始小批量梯度下降更新参数,直到参数足够拟合数据。每次更新需要计算损失函数关于模型参数的梯度,利用梯度,通过减小损失的方向更新每个参数,利用自动微分来计算梯度。​ 从数据集中随机抽取小批量,根据参数计算损失的梯度,朝着减少损失的方向更新参数。解析解可以进行很好的数学分析,但解析解对问题的限制很严格,导致它无法广泛应用在深度学习里。

2024-10-13 23:16:35 1776

原创 深度学习预备知识

深度学习的应用:图片分类:到如今的图片的分类正确率已经达到95%、物体检测和分割、样式迁移(图片合成,将不同图片风格合并)、人脸合成、文字生成:GPT(对话交流,写代码…)、无人驾驶:(计算机视觉的应用)

2024-10-12 16:09:14 755

原创 pytorch笔记

pytorch学习时的笔记

2024-10-03 20:45:29 999

原创 随机森林笔记

不是一个单独的学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,来过的比单个模型更好的回归或分类表现。多个模型集成成为的模型叫做集成评估器,其中的每个模型都叫做基评估器。有三类集成算法:装袋法(Bagging),提升法(Boosting),Stacking袋装法:构建多个相互独立的评估器,然后对其预测进行平均或多数表决原则来决定集成评估器的结果。装袋法的代表模型就是随机森林。提升法:基评估器是相关的,按顺序一一构建。

2023-09-23 18:29:13 111 1

原创 决策树笔记

决策树笔记

2023-09-17 21:13:14 116 1

原创 requests库实现爬虫

​ requests库是Python第三方库,处理URL资源特别方便,并且更加精简代码量(相较于urllib库)。

2023-07-17 16:09:03 166 1

原创 selenium页面爬取

​ selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器 在爬虫中的应用主要是用来解决JS渲染的问题。用于Web应用程序测试的工具,直接运行在浏览器中,像真正的用户一样操作,支持通过各种Driver驱动真实浏览器完成测试。像是一个网页测试。通过元素定位可以获得相应的元素,类似于选择处理。每次测试花费时间较长,不方便处理,js渲染等待时间长例子:搜索火影忍者点击下一页。

2023-07-15 21:37:05 256 1

原创 网页数据的解析提取

爬虫网页数据的解析提取

2023-07-15 15:39:03 306 1

原创 爬虫-urllib库

python 爬虫

2023-07-14 11:30:19 285 1

原创 Ajax笔记

ajax和传统请求的区别以及ajax的使用

2023-06-30 17:14:19 61

原创 汇编语言基础

汇编基础笔记

2023-02-15 16:29:09 255

原创 二分查找及简单应用

二分查找简单应用和例题

2022-12-17 23:36:16 264

原创 python之字典(dict)

了解python字典的使用

2022-08-30 08:59:04 113

原创 python元组

python的元组

2022-08-28 15:38:13 243

原创 vim的简单使用

vim的基本操作

2022-08-22 16:42:32 643

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除