- 博客(55)
- 收藏
- 关注
原创 Python训练营---DAY56
记忆口诀:p越小,落在置信区间外,越拒绝原假设。相信这次应该说清楚了假设检验相关的基础知识。自行构造数据集,来检查是否符合这个要求。P值、统计量、显著水平、置信区间。创造数据,并可视化进行ACF检验。时序部分需要铺垫的知识非常多,DAY 56 时序数据的检验。偏自相关性检验:PACF检验。序列分解:趋势+季节性+残差。自相关性检验:ACF检验和。Ljung-Box 检验。
2025-06-23 21:02:30
186
原创 Python训练营---DAY55
是一个长度为 10 的序列:y = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]手动构造类似的数据集(如cosx数据),观察不同的机器学习模型的差异。:生成的特征和标签对如下,总共生成了 7 个样本(经典机器学习在序列任务上的劣势;DAY 55 序列预测任务介绍。,但 SVM 和随机森林都。序列数据的处理:滑动窗口。多输入多输出任务的思路。
2025-06-19 17:26:57
190
原创 Python训练营---DAY53
不做处理:原始数据中类别分布天然存在不平衡风险(虽这里差异不算极端,但仍有倾向)。模型直接学习原始分布,对少数类的识别难度更高,F1 分数受类别平衡度影响更明显。GAN 生成类别 1 样本(:通过补充类别 1 的样本,调整了训练数据中类别分布,让模型在学习时能更 “公平” 接触两类特征,尤其缓解了类别 1 样本不足导致的学习偏差,提升了对类别 1 的预测稳定性,进而影响 F1 分数。
2025-06-13 22:02:20
615
原创 Python训练营---DAY52
作业:对于day'41的简单cnn,看看是否可以借助调参指南进一步提高精度。测试集准确率最好为80.44%,跟day41相差不是很大。测试最大允许的 batch size 函数。DAY 52 神经网络调参指南。配置优化器和学习率调度器函数。各部分参数的调整心得。
2025-06-12 22:27:11
337
原创 Python训练营---DAY50
ps:今日的代码训练时长较长,3080ti大概需要40min的训练时长。DAY 50 预训练模型+CBAM模块。尝试对vgg16+cbam进行微调策略。2、对vgg16+cbam进行微调策略。好好理解下resnet18的模型结构。1、resnet18模型结构。针对预训练模型的训练策略。CBAM放置位置的思考。resnet结构解析。
2025-06-10 22:23:57
224
原创 Python训练营---DAY48
DAY 48 随机函数与广播机制知识点回顾:随机张量的生成:torch.randn函数卷积和池化的计算公式(可以不掌握,会自动计算的)pytorch的广播机制:加法和乘法的广播机制ps:numpy运算也有类似的广播机制,基本一致作业:自己多借助ai举几个例子帮助自己理解即可1、随机张量的生成:torch.randn函数torch.rand():生成[0,1)范围内均匀分布的随机数torch.randint():生成指定范围内的随机整数。
2025-06-08 18:13:59
660
原创 Python训练营---Day47
conv1看「基础元素」→conv2拼「局部特征」→conv3抓「核心语义」,逐层让模型从 “看得到图像” 进化到 “看懂图像该关注什么”。
2025-06-07 21:21:12
346
原创 Python训练营---Day46
什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道。对比不同卷积层特征图可视化的结果(可选)DAY 46 通道注意力(SE注意力)不同CNN层的特征图:不同通道的特征图。通道注意力:模型的定义和插入的位置。引入通道注意力机制后,特征图可视化。通道注意力后的特征图和热力图。今日代码较多,理解逻辑即可。原始代码,特征图可视化。
2025-06-06 18:59:01
288
原创 Python训练营---Day45
对resnet18在cifar10上采用微调策略下,用tensorboard监控训练过程。tensorboard在cifar上的实战:MLP和CNN模型。DAY 45 Tensorboard使用介绍。tensorboard的发展历史和原理。tensorboard的常见操作。
2025-06-05 22:09:06
362
原创 Python训练营---Day44
选用 DenseNet121预训练模型,注意DenseNet121 模型的最后分类层名为。尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同。尝试通过ctrl进入resnet的内部,观察残差究竟是什么。预训练代码实战:resnet18。,而不是 ResNet 中的。DAY 44 预训练模型。图像预训练模型的发展史。常见的分类预训练模型。
2025-06-05 21:28:23
372
原创 Python训练营---Day43
kaggle找到一个图像数据集,用cnn网络进行训练并且用grad-cam做可视化。,对水母图片进行分类,共6个类别。进阶:并拆分成多个文件。DAY 43 复习日。
2025-06-02 17:54:17
345
原创 Python训练营---Day42
DAY 42 Grad-CAM与Hook函数知识点回顾回调函数lambda函数hook函数的模块钩子和张量钩子Grad-CAM的示例作业:理解下今天的代码即可1、回调函数回调函数(Callback Function)是一种特殊的函数,它作为参数传递给另一个函数,然后在那个函数内部被调用执行。简单来说,回调函数就是 "被别人调用的函数"。2、lambda函数lambda函数,它是一种匿名函数(没有正式名称的函数),最大特点是用完即弃,无需提前命名和定义。
2025-06-01 20:18:19
1667
原创 Python训练营---Day41
2. Flatten -> Dense (with Dropout,可选) -> Dense (Output)1. 输入 → 卷积层 → Batch归一化层(可选) → 池化层 → 激活函数 → 下一层。尝试手动修改下不同的调度器和CNN的结构,观察训练的差异。batch归一化:调整一个批次的分布,常用与图像数据。特征图:只有卷积操作输出的才叫特征图。调度器:直接修改基础学习率。卷积神经网络定义的写法。
2025-05-31 22:13:27
505
原创 Python训练营---Day40
由于深度mlp的参数过多,为了避免过拟合在这里引入了dropout这个操作,他可以在训练阶段随机丢弃一些神经元,避免过拟合情况。NLP任务中的张量形状:(batch_size, sequence_length),此时,batch_size同样是第一个维度。:仔细学习下测试和训练代码的逻辑,这是基础,这个代码框架后续会一直沿用,后续的重点慢慢就是转向模型定义阶段了。dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭dropout。彩色和灰度图片测试和训练的规范写法:封装在函数中。
2025-05-30 19:10:31
295
原创 Python训练营---Day39
定义两层MLP神经网络self.flatten = nn.Flatten() # 将28x28的图像展平为784维向量self.layer1 = nn.Linear(784, 128) # 第一层:784个输入,128个神经元self.relu = nn.ReLU() # 激活函数self.layer2 = nn.Linear(128, 10) # 第二层:128个输入,10个输出(对应10个数字类别)x = self.flatten(x) # 展平图像。
2025-05-29 18:16:17
1908
原创 Python训练营---Day38
Dataset类的__getitem__和__len__方法(本质是python的特殊方法),由加拿大安大略省高级研究所(CIFAR)收集整理。它包含多个版本,最常用的是。了解下cifar数据集,尝试获取其中一张图片。CIFAR 数据集是机器学习领域中常用的。minist手写数据集的了解。Dataloader类。
2025-05-27 17:34:06
359
原创 Python训练营---Day37
对信贷数据集训练后保存权重,加载权重后继续训练50轮,并采取早停策略。保存全部信息checkpoint,还包含训练状态。过拟合的判断:测试集和训练集同步打印指标。继续训练50轮,并采取早停策略。
2025-05-26 17:35:52
198
原创 Python训练营---Day36
对之前的信贷项目,利用神经网络训练下,尝试用到目前的知识点让代码更加规范和美观。仔细回顾一下神经网络到目前的内容,没跟上进度的同学补一下进度。:尝试进入nn.Module中,查看他的方法。探索性作业(随意完成)
2025-05-25 16:11:26
191
原创 Python训练营---Day35
三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。调整参数,构建三层神经网络,修改学习率为0.001。进度条功能:手动和自动写法,让打印结果更加美观。作业:调整模型定义时的超参数,对比下效果。推理的写法:评估模式。
2025-05-24 17:14:55
228
原创 Python训练营---Day34
知识点回归:CPU性能的查看:看架构代际、核心数、线程数GPU性能的查看:看显存、看级别、看架构代际GPU训练的方法:数据和模型移动到GPU device上类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)作业复习今天的内容,在巩固下代码。思考下为什么会出现这个问题。GPU反而比CPU慢,本质是GPU计算时比CPU多了三个时间开销:1、 数据传输开销 (CPU 内存 <-> GPU 显存)
2025-05-23 18:04:44
783
原创 Python训练营---Day33
1. 分类任务中,若标签是整数(如 0/1/2 类别),需转为long类型(对应 PyTorch 的torch.long),否则交叉熵损失函数会报错。2. 回归任务中,标签需转为float类型(如torch.float32)。今日的代码,要做到能够手敲。这已经是最简单最基础的版本了。查看显卡信息的命令行命令(cmd中使用)数据预处理(归一化、转换成张量)PyTorch和cuda的安装。继承nn.Module类。定义损失函数和优化器。
2025-05-22 21:15:37
264
原创 Python训练营---Day32
参考pdpbox官方文档中的其他类,绘制相应的图,任选即可。官方文档的阅读和使用:要求安装的包和文档为同一个版本。官方文档的检索方式:github和官网。绘图的理解:对底层库的调用。普通方法所需要的参数。
2025-05-21 16:07:32
142
原创 Python训练营---Day30
_init__.py (必需添加,将 model 目录标记为一个可导入的包)导入库/模块的核心逻辑:找到根目录(python解释器的目录和终端的目录不一致)3、main.py在根目录下,mul.py在子目录model下。main.py和mul.py在根目录的子目录model下。1、main.py和mul.py在同一根目录下。以计算乘法为例,mul.py中包含乘法方法。:自己新建几个不同路径文件尝试下如何导入。导入自定义库/模块的方式。导入官方库的三种手段。
2025-05-19 15:37:46
255
原创 Python训练营---Day29
类的初始化方法,有个默认参数# 类的普通方法# 类的普通方法circle=Circle(5) # 实例化类,使用初始化方法print(f"半径:{circle.radius}")print(f"面积:{circle.calculate_area():.2f}")print(f"周长:{circle.calculate_circumference():.2f}")def func(a,b,c=3,*args,**kwargs): # 位置参数,默认参数,可变参数,关键字参数。
2025-05-18 15:29:52
333
原创 Python训练营---Day28
calculate_circumference():计算圆的周长(公式:2πr)。calculate_perimeter():计算周长(公式:2×(长+宽))。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。is_square() 方法,判断是否为正方形(长 == 宽)。shape_type="circle":创建圆(参数:半径)。calculate_area():计算面积(公式:长×宽)。
2025-05-17 15:08:56
321
原创 Python训练营---Day27
编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)装饰器的思想:进一步复用。注意内部函数的返回值。
2025-05-16 15:42:47
172
原创 Python训练营---Day26
编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。函数的参数类型:位置参数、默认参数、不定参数。user_id 是一个必需的位置参数。
2025-05-15 16:36:07
353
原创 Python训练营---Day25
知识点回顾:异常处理机制debug过程中的各类报错try-except机制try-except-else-finally机制在即将进入深度学习专题学习前,我们最后差缺补漏,把一些常见且重要的知识点给他们补上,加深对代码和流程的理解。作业:理解今日的内容即可,可以检查自己过去借助ai写的代码是否带有try-except机制,以后可以尝试采用这类写法增加代码健壮性。一、异常处理机制逻辑说明: 程序首先尝试执行 try 块中的代码。
2025-05-14 17:12:43
1762
原创 Python训练营---Day21
知识点回顾:LDA线性判别PCA主成分分析t-sne降维作业:自由作业:探索下什么时候用到降维?降维的主要应用?或者让ai给你出题,群里的同学互相学习下。可以考虑对比下在某些特定数据集上t-sne的可视化和pca可视化的区别。一、为什么需要降维。
2025-05-14 15:06:07
774
原创 Python训练营---Day23
整理下全部逻辑的先后顺序,看看能不能制作出适合所有机器学习的通用pipeline。ColumnTransformer和Pipeline类。转化器和估计器的概念。
2025-05-12 18:29:19
135
原创 Python训练营---Day22
自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码。仔细回顾一下之前21天的内容,没跟上进度的同学补一下进度。
2025-05-11 21:27:24
213
原创 Python训练营---Day20
知识点回顾:线性代数概念回顾(可不掌握)奇异值推导(可不掌握)奇异值的应用特征降维:对高维数据减小计算量、可视化数据重构:比如重构信号、重构图像(可以实现有损压缩,k 越小压缩率越高,但图像质量损失越大)降噪:通常噪声对应较小的奇异值。通过丢弃这些小奇异值并重构矩阵,可以达到一定程度的降噪效果。推荐系统:在协同过滤算法中,用户-物品评分矩阵通常是稀疏且高维的。
2025-05-09 17:06:30
389
原创 Python训练营---Day19
常见的特征筛选算法方差筛选皮尔逊相关系数筛选lasso筛选树模型重要性shap重要性递归特征消除REF作业:对心脏病数据集完成特征筛选,对比精度。
2025-05-08 17:48:12
365
原创 Python训练营---Day18
参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。推断簇含义的2个思路:先选特征和后选特征。科研逻辑闭环:通过精度判断特征工程价值。通过可视化图形借助ai定义簇的含义。聚类后的分析:推断簇的类型。利用AI构造出新特征。
2025-05-07 22:42:55
285
原创 Python训练营---Day17
知识点聚类的指标聚类常见算法:kmeans聚类、dbscan聚类、层次聚类三种算法对应的流程实际在论文中聚类的策略不一定是针对所有特征,可以针对其中几个可以解释的特征进行聚类,得到聚类后的类别,这样后续进行解释也更加符合逻辑。聚类的流程标准化数据选择合适的算法,根据评估指标调参( )KMeans 和层次聚类的参数是K值,选完k指标就确定DBSCAN 的参数是 eps 和min_samples,选完他们出现k和评估指标以及层次聚类的 linkage准则等都需要仔细调优。
2025-05-06 23:34:34
284
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅