自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 Python 训练 day51

day43的时候我们安排大家对自己找的数据集用简单cnn训练,现在可以尝试下借助这几天的知识来实现精度的进一步提高。

2025-06-16 21:38:21 163

原创 Python 训练 day50

尝试对vgg16+cbam进行微调策略。好好理解下resnet18的模型结构。针对预训练模型的训练策略。CBAM放置位置的思考。resnet结构解析。

2025-06-13 22:21:21 109

原创 Python 训练 day49

现在大家已近可以去读这类文章了,应该已经可以无压力看懂三四区的很多这类文章。最近临近毕业,事情有点多。如果有之前的基础的话,今天的难度相对较低。尝试对今天的模型检查参数数目,并用tensorboard查看训练过程。后面说完几种模块提取特征的组合方式后,会提供整理的开源模块的文件。

2025-06-12 20:42:36 166

原创 Python 训练 day48

卷积和池化的计算公式(可以不掌握,会自动计算的)ps:numpy运算也有类似的广播机制,基本一致。pytorch的广播机制:加法和乘法的广播机制。随机张量的生成:torch.randn函数。自己多借助ai举几个例子帮助自己理解即可。

2025-06-11 22:43:42 135

原创 Python 训练 day47

昨天代码中注意力热图的部分顺移至今天。作业:对比不同卷积层热图可视化的结果。DAY 47 注意力热图可视化。

2025-06-10 22:19:34 129

原创 Python 训练 day46

什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道。对比不同卷积层特征图可视化的结果(可选)不同CNN层的特征图:不同通道的特征图。通道注意力:模型的定义和插入的位置。通道注意力后的特征图和热力图。今日代码较多,理解逻辑即可。

2025-06-09 22:41:01 452

原创 Python 训练 day45

对resnet18在cifar10上采用微调策略下,用tensorboard监控训练过程。tensorboard在cifar上的实战:MLP和CNN模型。tensorboard的发展历史和原理。tensorboard的常见操作。

2025-06-08 20:42:15 170

原创 Python 训练 day44

尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同。尝试通过ctrl进入resnet的内部,观察残差究竟是什么。预训练代码实战:resnet18。图像预训练模型的发展史。常见的分类预训练模型。

2025-06-07 23:06:38 147

原创 Python 训练 day43

kaggle找到一个图像数据集,用cnn网络进行训练并且用grad-cam做可视化。进阶:并拆分成多个文件。

2025-06-06 23:05:13 109

原创 Python 训练 day42

hook函数的模块钩子和张量钩子。Grad-CAM的示例。理解下今天的代码即可。

2025-06-05 23:03:19 109

原创 Python 训练 day41

Flatten -> Dense (with Dropout,可选) -> Dense (Output)1. 输入 → 卷积层 → Batch归一化层(可选) → 池化层 → 激活函数 → 下一层。尝试手动修改下不同的调度器和CNN的结构,观察训练的差异。batch归一化:调整一个批次的分布,常用与图像数据。特征图:只有卷积操作输出的才叫特征图。调度器:直接修改基础学习率。卷积神经网络定义的写法。

2025-06-04 23:07:18 221

原创 Python 训练 day40

仔细学习下测试和训练代码的逻辑,这是基础,这个代码框架后续会一直沿用,后续的重点慢慢就是转向模型定义阶段了。dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭dropout。展平操作:除第一个维度batchsize外全部展平。彩色和灰度图片测试和训练的规范写法:封装在函数中。

2025-06-02 21:33:39 308

原创 Python 训练 day39

batchisize和训练的关系。图像数据的格式:灰度和彩色数据。今日代码较少,理解内容即可。

2025-06-01 17:22:12 224

原创 Python 训练 day38

Dataset类的__getitem__和__len__方法(本质是python的特殊方法)了解下cifar数据集,尝试获取其中一张图片。minist手写数据集的了解。Dataloader类。

2025-05-30 22:17:19 94

原创 Python 训练 day37

对信贷数据集训练后保存权重,加载权重后继续训练50轮,并采取早停策略。保存全部信息checkpoint,还包含训练状态。过拟合的判断:测试集和训练集同步打印指标。

2025-05-28 22:41:56 269

原创 Python 训练 day36

对之前的信贷项目,利用神经网络训练下,尝试用到目前的知识点让代码更加规范和美观。仔细回顾一下神经网络到目前的内容,没跟上进度的同学补一下进度。

2025-05-27 19:12:22 214

原创 Python 训练 day35

调整后模型训练进度: 100%|██████████| 30000/30000 [00:29<00:00, 1033.96epoch/s, Loss=0.2562]原始模型训练进度: 100%|██████████| 20000/20000 [00:20<00:00, 977.14epoch/s, Loss=0.0627]三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。进度条功能:手动和自动写法,让打印结果更加美观。作业:调整模型定义时的超参数,对比下效果。

2025-05-26 21:18:56 214

原创 Python 训练 day34

类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)复习今天的内容,在巩固下代码。思考下为什么会出现这个问题。GPU训练的方法:数据和模型移动到GPU device上。CPU性能的查看:看架构代际、核心数、线程数。GPU性能的查看:看显存、看级别、看架构代际。复习今天的内容,在巩固下代码。

2025-05-25 17:59:04 167

原创 Python 训练 day33

今日的代码,要做到能够手敲。这已经是最简单最基础的版本了。查看显卡信息的命令行命令(cmd中使用)数据预处理(归一化、转换成张量)PyTorch和cuda的安装。继承nn.Module类。定义损失函数和优化器。

2025-05-24 15:43:13 126

原创 Python 训练 day32

参考pdpbox官方文档中的其他类,绘制相应的图,任选即可。官方文档的阅读和使用:要求安装的包和文档为同一个版本。官方文档的检索方式:github和官网。绘图的理解:对底层库的调用。普通方法所需要的参数。

2025-05-23 22:52:53 191

原创 Python 训练 day31

但是Python 3.x 默认为 UTF-8 编码,理论上可以省略编码声明。models/ 目录:专门存放训练好的模型文件,根据模型保存格式不同,可能是 .pkl(Python pickle 格式,常用于保存 sklearn 模型 )、.h5(常用于保存 Keras 模型 )、.joblib 等。另一个是pylance,用于代码提示和类型检查,这个插件会根据你的代码中的类型注解,给出相应的提示和检查,比如你定义了一个函数,参数类型是int,那么当你传入一个字符串时,它会提示你传入的参数类型不正确。

2025-05-22 22:34:40 902

原创 Python 训练 day30

但如果 circle.py 在更复杂的目录结构里,直接用 python model/main.py 可能会报错,这时可以用 python -m model.main ,Python 会把项目根目录加到搜索路径的开头,这样就能找到 model 文件夹里的 circle.py 了。- 运行方式 :有两种方式。- 模块导入 : main.py 要找 circle.py 就不能只喊名字了,得说清楚在哪个格子里,所以导入语句要写成 from model.circle import calculate_area。

2025-05-21 22:39:01 393

原创 Python 训练 day29

函数是一段具有特定功能的、可重用的代码。在编程语言中,它通常用来实现一个特定的任务,比如计算两个数的和、打印一段文本等。函数可以有输入参数,也可以有返回值。类是面向对象编程(OOP)中的一个核心概念。它是一种封装了数据和操作这些数据的函数(在类中称为方法)的代码模板。类可以看作是一种自定义的数据类型,它定义了一种数据的结构和行为。

2025-05-20 22:26:55 661

原创 Python 训练 day28

calculate_perimeter():计算周长(公式:2×(长+宽))。is_square() 方法,判断是否为正方形(长 == 宽)。calculate_circumference():计算圆的周长(公式:2πr)。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。shape_type="circle":创建圆(参数:半径)。calculate_area():计算面积(公式:长×宽)。

2025-05-19 21:58:15 304

原创 Python 训练 day27

编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)ps:第一期day27对应5月16日。DAY 27 函数专题2:装饰器。装饰器的思想:进一步复用。注意内部函数的返回值。

2025-05-18 22:41:53 133

原创 Python 训练 day26

编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。函数的参数类型:位置参数、默认参数、不定参数。user_id 是一个必需的位置参数。

2025-05-17 21:27:06 250

原创 Python 训练 day25

理解今日的内容即可,可以检查自己过去借助ai写的代码是否带有try-except机制,以后可以尝试采用这类写法增加代码健壮性。在即将进入深度学习专题学习前,我们最后差缺补漏,把一些常见且重要的知识点给他们补上,加深对代码和流程的理解。try-except-else-finally机制。debug过程中的各类报错。try-except机制。DAY 25 异常处理。

2025-05-16 21:31:49 135

原创 Python 训练 day24

知识点回顾:元组可迭代对象os模块作业:对自己电脑的不同文件夹利用今天学到的知识操作下,理解下os路径。

2025-05-15 20:22:06 899

原创 Python 训练 day22

整理下全部逻辑的先后顺序,看看能不能制作出适合所有机器学习的通用pipeline。ColumnTransformer和Pipeline类。转化器和估计器的概念。

2025-05-14 20:29:37 124

原创 Python 训练 day22

自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码。仔细回顾一下之前21天的内容,没跟上进度的同学补一下进度。

2025-05-12 22:01:36 168

原创 Python 训练 day21

DAY 21 常见的降维算法。

2025-05-11 21:56:27 188

原创 Python 训练 day20

对于任何矩阵(如结构化数据可以变为:样本*特征的矩阵,图像数据天然就是矩阵),均可做等价的奇异值SVD分解,对于分解后的矩阵,可以选取保留前K个奇异值及其对应的奇异向量,重构原始矩阵,可以通过计算Frobenius 范数相对误差来衡量原始矩阵和重构矩阵的差异。应用:结构化数据中,将原来的m个特征降维成k个新的特征,新特征是原始特征的线性组合,捕捉了数据的主要方差信息,降维后的数据可以直接用于机器学习模型(如分类、回归),通常能提高计算效率并减少过拟合风险。降噪:通常噪声对应较小的奇异值。

2025-05-10 22:08:01 273

原创 Python 训练 day19

对心脏病数据集完成特征筛选,对比精度。DAY 19 常见的特征筛选算法。

2025-05-09 18:15:45 265

原创 Python 训练 day18

总结:该簇人群在心脏应激状态下(如运动时),心脏电生理变化相对缓和,胸痛症状不显著,整体心脏对负荷的反应较为平稳,可能提示心脏功能处于相对良好的状态,患心脏病风险相对较低。总结:此簇人群在心脏承受负荷时,反应较为强烈,心脏电生理改变明显,胸痛症状可能较为突出,心脏在应激状态下负担较重,患心脏病的风险相对较高,需要进一步医学评估和监测。特征:thalach 处于中等水平,但 oldpeak 值有明显异常升高情况,slope 偏离正常范围,呈现异常的斜率特征,cp 情况相对分散。簇 2:高心率反应簇。

2025-05-08 20:37:42 292

原创 Python 训练 day17

聚类常见算法:kmeans聚类、dbscan聚类、层次聚类。对心脏病数据集进行聚类。

2025-05-07 14:40:58 202

原创 Python 训练 day16

NumPy 数组基础笔记1. 理解数组的维度 (Dimensions)NumPy 数组的**维度 (Dimension)** 或称为 **轴 (Axis)** 的概念,与我们日常理解的维度非常相似。直观判断:数组的维度层数通常可以通过打印输出时中括号 `[]` 的嵌套层数来初步确定:* 一层 `[]`: **一维 (1D)** 数组。* 两层 `[]`: **二维 (2D)** 数组。* 三层 `[]`: **三维 (3D)** 数组,依此类推。

2025-05-06 16:46:48 340

原创 Python 训练 day15

尝试找到一个kaggle或者其他地方的结构化数据集,用之前的内容完成一个全新的项目,这样你也是独立完成了一个专属于自己的项目。仔细回顾一下之前14天的内容,没跟上进度的同学补一下进度。

2025-05-05 22:43:34 150

原创 Python 训练 day14

【代码】Python 训练 day14。

2025-05-04 21:25:05 145

原创 Python 训练 day13

从示例代码可以看到 效果没有变好,所以很多步骤都是理想是好的,但是现实并不一定可以变好。这个实验仍然有改进空间,如下。1. 我还没做smote+过采样+修改权重的组合策略,有可能一起做会变好。2. 我还没有调参,有可能调参后再取上述策略可能会变好。不平衡数据集的处理策略:过采样、修改权重、修改阈值。

2025-05-02 19:24:26 171

原创 Python 训练 day12

因为在优化问题中,很容易陷入局部最优解,就像在一个山地环境中,你站在一个小山丘的山顶,你以为这是最高的地方,但其实这只是局部最高点,真正的最高峰在远处。当温度降低到一定程度后,算法就只会接受比当前解更好的解,就像材料冷却后原子只能按照更稳定、更有序的方式排列一样。的思路为主,尝试检索资料、视频、文档,用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑,帮助更深入的理解。就像物理中的温度控制原子的活跃程度一样,在算法中,温度决定了算法接受新解的概率。随着算法的进行,温度会逐渐降低。

2025-05-01 20:37:28 943

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除