自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 Day56时序数据的检验

【代码】Day56时序数据的检验。

2025-07-08 12:21:40 106

原创 Day55 序列预测

举个例子,比如有过去30天的股票价格,我们希望预测第31天的价格。比如之前的单车预测,有前60天的单车需求数据,希望预测后面20天的销量。或者文本,人的语言是有顺序的,预测下一个单词是这也是序列预测任务。我们之前接触到的结构化数据,它本身不具备顺序,我们认为每个样本之间独立无关,样本之间即使调换顺序,仍然不影响模型的训练。但是日常中很多数据是存在先后关系的,而他们对应的任务是预测下一步的值,我们把这个任务称之为序列预测。

2025-07-07 16:56:17 193

原创 Day53GAN对抗生成网络思想

其核心思想源于博弈论中的零和博弈,通过两个神经网络(生成器和判别器)的对抗性训练,实现数据的高质量生成。◦ 判别器(Discriminator):接收真实数据与生成器输出的假样本,输出一个概率值(0~1),判断输入是否为真实数据,目标是最大化分类准确率。◦ 生成器(Generator):接收随机噪声(如高斯分布)作为输入,生成与真实数据相似的假样本(如图像、文本),目标是欺骗判别器。◦ 阶段1(更新判别器):固定生成器,用真实数据和生成样本训练判别器,优化其区分能力。

2025-07-06 23:45:42 358

原创 Day52

随机种子(Random Seed)在机器学习中是一个用于控制随机过程可复现性的关键参数,它通过初始化伪随机数生成器,确保实验结果的稳定性与可重复性。• 定义:随机种子是一个整数(如 42),作为伪随机数生成算法的起始点。• 公平比较模型:在对比不同模型结构或超参数时,固定种子可排除随机性干扰,凸显目标变量的影响(如ResNet与VGG的性能差异仅因模型结构引起)。• 实验结果可复现:固定种子后,模型的参数初始化、数据划分、正则化操作(如Dropout)等随机过程完全一致,确保他人能复现相同结果。

2025-07-05 23:49:44 392

原创 DAY 51 预训练模型+CBAM模块

预训练模型的结构和权重是固定的,如果修改其中的模型结构,是否会大幅影响其性能。其次是训练的时候如何训练才可以更好的避免破坏原有的特征提取器的参数。现在我们思考下,是否可以对于预训练模型增加模块来优化其效果,这里我们会遇到一个问题。1. resnet18中如何插入cbam模块?所以今天的内容,我们需要回答2个问题。针对预训练模型的训练策略。CBAM放置位置的思考。resnet结构解析。

2025-07-04 11:24:51 227

原创 Day50

不平衡数据的进一步处理----异常检测增加内容(smote和权重不能同时用到)day31 typing内置模块功能和pylance的类型注解 做补充介绍。day22和day24的顺序更换,先介绍os模块 要求kaggle平台。开发个一个在线平台,做打卡统计,比微信直接爬取记录要方便。补充额外注释的概念--函数、类 变量的类型注解法。新增机器学习模型的保存,如随机森林权重参数的保存。day38的作业布置的不好,用的是彩色数据集。把day31的类型注解放到day29复习日。补充在之前参数的部分。

2025-07-03 22:44:43 159

原创 DAY 49 CBAM注意力

现在大家已近可以去读这类文章了,应该已经可以无压力看懂三四区的很多这类文章。作业:尝试对今天的模型检查参数数目,并用tensorboard查看训练过程。最近临近毕业,事情有点多。如果有之前的基础的话,今天的难度相对较低。后面说完几种模块提取特征的组合方式后,会提供整理的开源模块的文件。1. 通道注意力模块复习。2. 空间注意力模块。3. CBAM的定义。

2025-07-02 15:46:23 94

原创 DAY 48 随机函数与广播机制

2. 卷积和池化的计算公式(可以不掌握,会自动计算的)3. pytorch的广播机制:加法和乘法的广播机制。1. 随机张量的生成:torch.randn函数。ps:numpy运算也有类似的广播机制,基本一致。

2025-07-01 22:41:34 106

原创 DAY 47 注意力热图可视化

sns.heatmap(corr, annot=True, cmap='coolwarm', center=0) # 中心为0,红蓝双色。plt.xticks(range(5), ['A', 'B', 'C', 'D', 'E']) # 自定义X轴标签。plt.yticks(range(5), ['组1', '组2', '组3', '组4', '组5'])labels=dict(x="X轴", y="Y轴", color="值"),'员工': ['Alice', 'Bob', 'Charlie'],

2025-06-30 15:52:19 495

原创 DAY 46 通道注意力(SE注意力)

2. 什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道。1. 不同CNN层的特征图:不同通道的特征图。3. 通道注意力:模型的定义和插入的位置。4. 通道注意力后的特征图和热力图。

2025-06-29 15:24:27 131

原创 DAY 45 Tensorboard使用介绍

3. 实际上对目前的ai而言,你只需要先完成最简单的demo,然后让他给你加上tensorboard需要打印的部分即可。启动tensorboard的时候需要先在cmd中进入对应的环境,conda activate xxx,再用cd命令进入环境(如果本来就是正确的则无需操作)。2. tensorboard的代码还有有一定的记忆量,实际上深度学习的经典代码都是类似于八股文,看多了就习惯了,难度远远小于考研数学等需要思考的内容。3. tensorboard在cifar上的实战:MLP和CNN模型。

2025-06-28 21:10:40 197

原创 DAY 45 Tensorboard使用介绍

3. tensorboard在cifar上的实战:MLP和CNN模型。1. tensorboard的发展历史和原理。2. tensorboard的常见操作。

2025-06-28 12:09:11 99

原创 DAY 44 预训练模型

1. 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同。2. 尝试通过ctrl进入resnet的内部,观察残差究竟是什么。5. 预训练代码实战:resnet18。3. 图像预训练模型的发展史。2. 常见的分类预训练模型。

2025-06-28 01:02:38 390

原创 DAY 43 复习日

kaggle找到一个图像数据集,用cnn网络进行训练并且用grad-cam做可视化。进阶:并拆分成多个文件。

2025-06-26 18:30:51 128

原创 DAY 42 Grad-CAM与Hook函数

3. hook函数的模块钩子和张量钩子。4. Grad-CAM的示例。2. lambda函数。

2025-06-25 10:02:21 313

原创 DAY 41 简单CNN

2. Flatten -> Dense (with Dropout,可选) -> Dense (Output)1. 输入 → 卷积层 → Batch归一化层(可选) → 池化层 → 激活函数 → 下一层。3. batch归一化:调整一个批次的分布,常用与图像数据。4. 特征图:只有卷积操作输出的才叫特征图。5. 调度器:直接修改基础学习率。2. 卷积神经网络定义的写法。

2025-06-24 08:29:56 90

原创 DAY 40 训练和测试的规范写法

3. dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭dropout。2. 展平操作:除第一个维度batchsize外全部展平。1. 彩色和灰度图片测试和训练的规范写法:封装在函数中。

2025-06-24 00:11:37 109

原创 DAY 39 图像数据与显存

4. batchisize和训练的关系。1. 图像数据的格式:灰度和彩色数据。3. 显存占用的4种地方。a. 模型参数+梯度参数。d. 神经元输出中间状态。c. 数据批量所占显存。

2025-06-22 23:31:51 99

原创 DAY 38 Dataset和Dataloader类

现在我们想要取出来一个图片,看看长啥样,因为datasets.MNIST本质上集成了torch.utils.data.Dataset,所以自然需要有对应的方法。Dataset类的__getitem__和__len__方法(本质是python的特殊方法)了解下cifar数据集,尝试获取其中一张图片。minist手写数据集的了解。__getitem__方法。二、Dataloader类。Dataloader类。一、Dataset类。

2025-06-21 23:31:30 393

原创 DAY 37 早停策略和模型权重的保存

c. 保存全部信息checkpoint,还包含训练状态。1. 过拟合的判断:测试集和训练集同步打印指标。2. 模型的保存和加载。b. 保存权重和模型。

2025-06-20 23:09:04 319

原创 D36review

仔细回顾一下神经网络到目前的内容,没跟上进度的同学补一下进度。

2025-06-19 23:50:10 114

原创 DAY 35 模型可视化与推理

为了了解参数总量,我们需要知道层设计,以及每一层参数的数量。三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。1. 了解损失如何定义的,知道损失从何而来----把抽象的任务通过损失函数量化出来。2. 了解参数总量,即知道每一层的设计才能退出---层设计决定参数总量。1.2 torchsummary库的summary方法。1.3 torchinfo库的summary方法。作业:调整模型定义时的超参数,对比下效果。推理的写法:评估模式。

2025-06-18 23:44:36 326

原创 DAY 34 GPU训练及类的call方法

类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)ps:在训练过程中可以在命令行输入nvida-smi查看显存占用情况。GPU训练的方法:数据和模型移动到GPU device上。CPU性能的查看:看架构代际、核心数、线程数。GPU性能的查看:看显存、看级别、看架构代际。

2025-06-17 00:11:12 295

原创 DAY 33 MLP神经网络的训练

1. 分类任务中,若标签是整数(如 0/1/2 类别),需转为long类型(对应 PyTorch 的torch.long),否则交叉熵损失函数会报错。在新建网络的时候,我们选择了2层隐藏层和固定的神经元,这类似于我们在机器学习模型中指定一组超参数,神经网络的调参我们未来再提。回归任务中,标签需转为float类型(如torch.float32)。查看显卡信息的命令行命令(cmd中使用)数据预处理(归一化、转换成张量)PyTorch和cuda的安装。继承nn.Module类。定义损失函数和优化器。

2025-06-17 00:08:32 179

原创 DAY 32 官方文档的阅读

我们已经掌握了相当多的机器学习和python基础知识,现在面对一个全新的官方库,看看是否可以借助官方文档的写法了解其如何使用。3. 官方文档:https://pdpbox.readthedocs.io/en/latest/1. GitHub 仓库:https://github.com/SauceCat/PDPbox。2. PyPI 页面:https://pypi.org/project/PDPbox/官方文档的阅读和使用:要求安装的包和文档为同一个版本。官方文档的检索方式:github和官网。

2025-06-15 17:55:13 167

原创 DAY 31 文件的规范拆分和写法

例如, day30 模块和包的导入 目录下的 sub_module.py 文件。在Python包目录下添加 __init__.py 文件,可将目录作为包导入。将不同功能的代码分到不同文件,每个文件负责单一功能。尝试针对之前的心脏病项目ipynb,将他按照今天的示例项目整理成规范的形式,思考下哪些部分可以未来复用。项目文件夹中其他部分:拆分后的信贷项目,学习下如何拆分的,未来你看到的很多大项目都是类似的拆分方法。notebook文件夹内的ipynb文件,介绍下今天的思路。用 __init__.py 文件。

2025-06-14 10:00:00 238

原创 DAY 30 模块和库的导入

不同目录导入 :若模块在不同目录,可将模块所在目录添加到 sys.path。2.from ... import ... 导入 :只导入模块里的某些属性,而非整个模块,能减少命名空间污染。1. import 导入 :将整个模块的所有功能导入到当前模块。可以一次导入多个模块,但调用模块函数时需完整写模块名。3.import ... as ... 别名导入 :给模块起别名,使用时更简洁。导入库/模块的核心逻辑:找到根目录(python解释器的目录和终端的目录不一致)导入自定义库/模块的方式。

2025-06-13 12:13:03 343

原创 DAY 29 复习日:类的装饰器

装饰器思想的进一步理解:外部修改、动态。类方法的定义:内部定义和外部定义。

2025-06-12 07:30:00 208

原创 DAY 28 类的定义和方法

calculate_perimeter():计算周长(公式:2×(长+宽))。is_square() 方法,判断是否为正方形(长 == 宽)。calculate_circumference():计算圆的周长(公式:2πr)。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。shape_type="circle":创建圆(参数:半径)。calculate_area():计算面积(公式:长×宽)。

2025-06-11 21:52:06 324

原创 DAY 27 函数专题2:装饰器

编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)装饰器的思想:进一步复用。注意内部函数的返回值。

2025-06-10 15:31:41 119

原创 DAY 26 函数专题1

编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。函数打印出用户ID,然后逐行打印所有提供的额外信息(键和值)。函数返回计算得到的面积。

2025-06-09 19:31:19 786

原创 D25异常处理

提示:优先掌握 IDE 调试器(如 VSCode 或 PyCharm)和。,覆盖 90% 的调试场景。PDB 适合无图形界面环境(如服务器)。

2025-06-08 15:22:26 1722

原创 DAY 24 元组和OS模块

OS是管理计算机硬件与软件资源的系统软件,充当用户与硬件的桥梁。

2025-06-07 21:16:48 990

原创 DAY 23 pipeline管道

转换器(transformer)是一个用于对数据进行预处理和特征提取的 estimator,它实现一个 transform 方法,用于对数据进行预处理和特征提取。在管道机制中,可以使用Pipeline类来组织和连接不同的转换器和估计器。之所以提到管道,是因为后续你在阅读一些经典的代码的时候,尤其是官方文档,非常喜欢用管道来构建代码,甚至深度学习中也有类似的代码,初学者往往看起来很吃力。在机器学习中,通常会按照一定的顺序对数据进行预处理、特征提取、模型训练和模型评估等步骤,以实现机器学习模型的训练和评估。

2025-06-07 00:14:53 902

原创 DAY 22 Kaggle 比赛

Kaggle 没有专门的团队来帮助排查您的代码问题,因此您通常会发现,通过在相应的论坛中提出您的问题,您会更快地收到回复。正如我们之前提到的,Kaggle Notebooks是我们的无需设置、可定制的Jupyter Notebooks环境,配有免费的GPU和一个巨大的社区发布数据和代码库。在本次比赛中,您将可以访问两个类似的数据集,其中包括乘客信息,如姓名、年龄、性别、社会经济阶层等。一旦您认为您已经创建了一个有竞争力的模型,请将其提交给 Kaggle,以查看您的模型。预测这些结果是你的工作。

2025-06-05 15:42:37 356

原创 DAY 21 常见的降维算法

​核心概念​特征降维是将高维数据(如数千个特征)映射到低维空间(如几十个特征)的过程。例如,图像数据从256×256像素(65536维)压缩至几十维,同时保留关键特征。其核心目标包括:​避免维数灾难​:高维数据导致计算复杂、距离度量失效。​去除噪声与冗余​:剔除无关或弱相关特征,提升数据质量。​提升效率与可解释性​:降低计算成本,加速模型训练,并便于数据可视化。特征降维通过特征选择或特征提取,解决高维数据的计算与信息冗余问题,是提升机器学习模型性能的关键步骤。

2025-06-05 15:40:32 298

原创 DAY 20 奇异值SVD分解

奇异值分解这个理论,对于你未来无论是做图像处理、信号处理、特征提取、推荐系统等都非常重要,所以需要单独抽出来说一下这个思想。---甚至我在非常多文章中都看到单独用它来做特征提取(伪造的很高大上),学会这个思想并不复杂没学过线代的不必在意,推导可以不掌握,关注输入输出即可。今天这期有点类似于帮助大家形成闭环---考研数学不是白考的线性代数概念回顾(可不掌握)奇异值推导(可不掌握)奇异值的应用特征降维:对高维数据减小计算量、可视化。

2025-06-03 22:18:13 1794

原创 DAY 19 常见的特征筛选算法

以上方法可单独或组合使用,实践中需结合数据特性与模型目标验证效果。代码实现详见各示例,参数调整是关键。

2025-06-02 17:15:08 2072

原创 DAY 18 推断聚类后簇的类型

推断簇类型需结合​​数据特性​​(形状、密度)与​​业务目标​​。优先尝试“后选特征法”+可视化全面探索,再通过“先选特征法”聚焦业务解释。最终需以监督模型验证聚类的实际价值(如预测效果提升)。若效果未达预期,可尝试过采样(SMOTE)或调整聚类算法进一步优化。代码实现:# 先运行之前预处理好的代码import pandas as pd #用于数据处理和分析,可处理表格数据。import numpy as np #用于数值计算,提供了高效的数组操作。

2025-06-01 16:35:11 685

原创 DAY 18 推断聚类后簇的类型

参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。选用昨天kmeans得到的效果进行聚类,进而推断出每个簇的实际含义。推断簇含义的2个思路:先选特征和后选特征。科研逻辑闭环:通过精度判断特征工程价值。通过可视化图形借助ai定义簇的含义。聚类后的分析:推断簇的类型。

2025-06-01 16:15:00 296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除