心落薄荷糖-优快云博客

原创 Day50 预训练模型+CBAM模块

【代码】Day50 预训练模型+CBAM模块。

2025-07-06 23:04:48 169

在主执行流程中，初始化模型后，立刻使用 torchsummary.summary 来打印模型的详细参数信息。在主执行流程中，初始化 SummaryWriter，创建唯一的日志目录。add_scalar：记录训练/测试的损失和准确率，以及学习率。add_histogram：定期记录权重和梯度的分布。将 writer 对象传递给 train 函数。add_graph：记录模型结构。add_image：记录样本图像。

2025-07-05 23:31:24 216

原创 Day48

【代码】Day48。

2025-07-04 23:29:32 114

原创 Day47 注意力热图可视化

【代码】Day47 注意力热图可视化。

2025-07-03 22:19:06 131

原创 Day46

---------------------- 全连接层（分类器） ----------------------# ---------------------- 第一个卷积块 ----------------------# ---------------------- 第二个卷积块 ----------------------# ---------------------- 第三个卷积块 ----------------------# Sigmoid将输出值归一化到[0,1]，表示通道重要性权重。

2025-07-02 23:29:30 1493

原创 Day45

虽然它们也能处理32x32的CIFAR-10图像，但为了更好地利用预训练权重，一个常见的做法是将小图像放大到224x224。”:中，代码逻辑非常清晰：设置参数 -> 初始化TensorBoard写入器 -> 准备数据 -> 创建模型 -> 调用总控函数开始训练 -> 结束并关闭写入器。标准化参数：使用了ImageNet数据集的标准化均值和标准差，这是使用在ImageNet上预训练的模型的标准做法。模型图 (add_graph)：在训练开始前，将模型的结构图写入日志，方便在GRAPHS标签页查看。

2025-07-01 19:47:05 689

原创 Day44

常见模型：图像有AlexNet、ResNet、ViT；NLP有BERT、GPT。图像模型发展：从手工特征到深度学习，从CNN到Transformer、多模态。预训练概念：在大规模数据上训练模型学习通用知识，再迁移到下游任务微调。预训练策略：数据增强、自监督/监督训练、模型微调、多模态学习。

2025-06-30 22:22:31 186

原创 DAY 43复习日

【代码】DAY 43复习日。

2025-06-29 22:25:15 264

原创 Day42

print(f'Epoch {epoch+1}/{epochs} 完成 | 训练准确率: {epoch_train_acc:.2f}% | 测试准确率: {epoch_test_acc:.2f}%')plt.plot(epochs, train_acc, 'b-', label='训练准确率')plt.plot(epochs, test_loss, 'r-', label='测试损失')plt.plot(epochs, train_loss, 'b-', label='训练损失')

2025-06-28 23:26:14 612

原创 Day41

2.Flatten -> Dense (with Dropout，可选) -> Dense (Output)输入 → 卷积层 → Batch归一化层（可选） → 池化层 → 激活函数 → 下一层。3.batch归一化：调整一个批次的分布，常用与图像数据。4.特征图：只有卷积操作输出的才叫特征图。5.调度器：直接修改基础学习率。2.卷积神经网络定义的写法。

2025-06-27 22:46:51 195

原创 Day40-训练和测试的规范写法

【代码】Day40-训练和测试的规范写法。

2025-06-26 22:43:53 206

原创 day39

【代码】day39。

2025-06-25 20:01:31 234

原创 day38

【代码】day38。

2025-06-24 17:27:08 168

原创 Day37

作业：对信贷数据集训练后保存权重，加载权重后继续训练50轮，并采取早停策略。c. 保存全部信息checkpoint，还包含训练状态。过拟合的判断：测试集和训练集同步打印指标。b. 保存权重和模型。

2025-06-23 21:01:01 170

原创 day36

● 作业：对之前的信贷项目，利用神经网络训练下，尝试用到目前的知识点让代码更加规范和美观。● 探索性作业（随意完成）：尝试进入nn.Module中，查看他的方法。仔细回顾一下神经网络到目前的内容，没跟上进度的同学补一下进度。

2025-06-22 20:37:12 152

原创 Day35

三种不同的模型可视化方法：推荐torchinfo打印summary+权重分布可视化。进度条功能：手动和自动写法，让打印结果更加美观。作业：调整模型定义时的超参数，对比下效果。推理的写法：评估模式。

2025-06-21 14:41:27 118

原创 Day34

【代码】Day34。

2025-06-20 20:23:50 319

原创 Day33

【代码】Day33。

2025-06-19 20:07:17 150

原创 Day32

参考 pdpbox 官方文档绘制的 Partial Dependence Plot (PDP) 和 Individual Conditional Expectation (ICE) 的类图设计（使用 PlantUML 语法）

2025-06-18 21:36:59 215

原创 Day31

作业：尝试针对之前的心脏病项目ipynb，将他按照今天的示例项目整理成规范的形式，思考下哪些部分可以未来复用。

2025-06-17 21:13:51 201

原创 day30

导入库/模块的核心逻辑：找到根目录（python解释器的目录和终端的目录不一致）作业：自己新建几个不同路径文件尝试下如何导入。导入自定义库/模块的方式。导入官方库的三种手段。

2025-06-16 21:25:52 206

原创 Day29

类装饰器接收一个类，返回一个修改后的类。其主要作用是在不修改类内部代码的情况下，为多个类统一添加功能，如添加新的方法或属性、修改原有方法，甚至返回一个全新的类。对于类而言， @decorator 语法是 MyClass = decorator(MyClass) 的简写，即使类已定义，仍可手动调用装饰器函数修改它。外部定义：定义函数后赋值给类属性（如 cls.fn = fn ），这是一种动态方法，常在装饰器、元类、动态编程中使用。方法可以直接访问类的其他私有成员，类定义后方法固定，常用于常规类定义。

2025-06-15 20:51:07 178

原创 DAY 28 类的定义和方法

【代码】DAY 28 类的定义和方法。

2025-06-14 17:46:56 275

原创 DAY 27 函数专题2：装饰器

【代码】DAY 27 函数专题2：装饰器。

2025-06-12 10:12:57 206

原创 DAY 26 函数专题1

函数定义与参数知识点回顾：1. 函数的定义2. 变量作用域：局部变量和全局变量3. 函数的参数类型：位置参数、默认参数、不定参数4. 传递参数的手段：关键词参数5。

2025-06-11 10:16:39 395

原创 DAY 25 异常处理

@浙大疏锦行

2025-06-10 11:16:49 126

原创 DAY 24 元组和OS模块

【代码】DAY 24 元组和OS模块。

2025-06-09 17:53:25 133

原创 DAY 23 pipeline管道

【代码】DAY 23 pipeline管道。

2025-06-08 21:44:44 176

原创 DAY 22 复习日

【代码】DAY 22 复习日。

2025-06-07 20:03:09 195

原创 Day21-常见的降维算法

PCA等无监督降维方法的目标是保留数据的最大方差，这些方差大的方向不一定是对分类最有用的方向。因此，在分类任务中，LDA通常比PCA更直接有效。默认参数随机森林 (训练集 -> 测试集)训练与预测耗时: 1.1859 秒。

2025-06-06 19:10:31 246

原创 DAY 20 奇异值SVD分解

对训练集和测试集进行标准后的奇异值分解。

2025-06-05 10:09:46 138

原创 DAY 19 常见的特征筛选算法

【代码】DAY 19 常见的特征筛选算法。

2025-06-04 17:30:45 220

原创 DAY 18 推断聚类后簇的类型

作业：参考示例代码对心脏病数据集采取类似操作，并且评估特征工程后模型效果有无提升。1.推断簇含义的2个思路：先选特征和后选特征。3.科研逻辑闭环:通过精度判断特征工程价值。2.通过可视化图形借助ai定义簇的含义。聚类后的分析：推断簇的类型。

2025-06-03 10:57:10 259

原创 DAY 17 常见聚类算法

【代码】DAY 17 常见聚类算法。

2025-06-02 23:24:16 226

原创 Day16-数组的常见操作和形状

【代码】Day16-数组的常见操作和形状。

2025-06-01 23:42:04 215

原创 DAY 15 复习日

数据集地址：https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data。尝试找到一个kaggle或者其他地方的结构化数据集，用之前的内容完成一个全新的项目，这样你也是独立完成了一个专属于自己的项目。房价预测（基于 Kaggle House Prices 数据集）目标：通过分析房屋特征，构建回归模型预测房价。

2025-05-31 19:24:19 270

原创 DAY 14 SHAP图的绘制

【代码】DAY 14 SHAP图的绘制。

2025-05-29 22:10:17 199

原创 Day13 不平衡数据的处理

从示例代码可以看到效果没有变好，所以很多步骤都是理想是好的，但是现实并不一定可以变好。这个实验仍然有改进空间，如下。1.不平衡数据集的处理策略：过采样、修改权重、修改阈值。修改权重、交叉验证代码。

2025-05-27 23:40:32 187

原创 DAY 12 启发式算法

作业：今天以自由探索的思路为主，尝试检索资料、视频、文档，用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑，帮助更深入的理解。三种启发式算法的示例代码：遗传算法、粒子群算法、退火算法。学习优化算法的思路（避免浪费无效时间）

2025-05-26 23:34:36 232

原创 DAY 11 常见的调参方式

对于信贷数据的其他模型，如LightGBM和KNN 尝试用下贝叶斯优化和网格搜索。贝叶斯优化（2种实现逻辑，以及如何避开必须用交叉验证的问题）随机搜索（简单介绍，非重点实战中很少用到，可以不了解）time库的计时模块，方便后人查看代码运行时长。

2025-05-25 23:12:45 272

空空如也

空空如也