Y317429-优快云博客

原创 Python Day52 学习（日志Day21复习）

是 Pandas 和 NumPy 中常用的方法，用于返回某个数组或序列中所有不重复的元素。今日复习到这里，明日接着复习SMOTE。，让模型在学习过程中更加关注某些类别或样本。在随机森林、逻辑回归等模型中，可以通过参数。返回该列中所有不同的取值，结果是一个数组。“加权模型”指的是在训练机器学习模型时，返回数组中所有唯一值，并默认排序。手写笔记复习（“随机过采样”部分）自动为少数类分配更高权重。补充：关于“加权模型”补充：关于“加权模型”

2025-06-15 10:08:30 347

原创 Python Day51 学习（日志Day20复习）

适应度函数就像“打分标准”，用来评价每一个候选解的优劣。分数越高，说明这个解越优秀，越接近我们想要的目标。今日复习到这里，这一部分主要关注其输入输出，会调用即可。适应度函数就是用来“打分”，帮助算法找到最优解的标准。”的函数，常见于遗传算法、进化算法、贝叶斯优化等智能优化方法中。适应度函数（Fitness Function）是用来。衡量一个解（或模型）“好坏。准确率（accuracy）补充：关于“适应度函数”补充：关于“适应度函数”

2025-06-14 17:34:48 561

原创 Python Day50 学习（仍为日志Day19的内容复习）

确定目标 → 选超参数 → 定范围 → 选方法 → 划分数据 → 运行调参 → 选最优 → 测试集评估这样可以保证模型既不过拟合，也能达到最优效果。手写笔记复习（贝叶斯优化）今日复习到这里，明日继续加油!!!

2025-06-13 20:37:56 535

原创 Python Day49 学习（日志Day19复习）

补充：调整超参数的原因补充：调整超参数的原因补充：关于“验证集”验证集（Validation Set）是机器学习中非常重要的一个概念。

2025-06-12 20:54:55 442

原创 Python Day 48 学习（日志Day18学习）

这些算法本质上都是“根据已知信息，帮你做分类或预测”，只是“做决策的方法”不同。有的靠投票，有的靠一步步筛选，有的靠概率，有的靠不断纠错。你可以把它们想象成不同风格的“决策顾问”，帮你解决问题。手写笔记复习今天复习到这里，明日继续，加油！！！

2025-06-11 18:04:55 419

原创 Python Day47 学习（日志Day16-17复习）

今日复习到这里，明日继续剩余几种算法的复习。第二遍复习时发现第一遍的学习不够细致，导致一些知识有遗漏，从而造成“不理解”的局面，这几日结合手写的方式复习后，对“如何处理一份数据”和“代码为什么这样写”有了更清晰的认识。接下来继续复习下面内容的同时，前面已学习过的代码还得经常手下练习着，总归是熟练功。勘误：Day17中应为“划分数据集”，而非“划分数据值”

2025-06-10 17:04:45 183

原创 python Day46 学习（日志Day15复习）

今日学习到这里，明日继续加油！Q. 关于"range()"Q. 关于"range()"

2025-06-09 22:05:13 561

原创 Python Day45 学习（日志Day13-14复习）

今日复习到这里，明日复习"子图的绘制”，并用“心脏病数据集”对数据预处理部分进行学习情况检测，继续查漏补缺。比训练营的正常学习进度落后了很多，但没办法，学得卡住了。既然卡住了就说明前面的内容自己还是没有彻底掌握，那就重头再来，待前面彻底掌握再进行更深入内容的学习。一切以“掌握”为主，继续加油吧！补充：关于“热力图”的阅读。补充：关于“数据预处理”补充：关于“数据预处理”为什么要进行数据预处理？

2025-06-08 11:01:11 451

原创 Python Day44 学习（日志Day12复习）

注：这里AI给出的“适用场景”存在问题。关于性别，为二分类问题，不需要使用独热编码。三分类以上才涉及独热编码。出现问题：忘记之前已对数据进行了独热编码，导致映射出来的值为空值。对信贷数据重新进行标签编码（回写昨日复习的代码）对信贷数据重新进行标签编码（回写昨日复习的代码）补充：对数据进行“归一化”和“标准化”的作用。补充：“独热编码”与“标签编码”的选择。

2025-06-07 11:59:33 496

原创 Python Day43 学习（日志Day10-11复习）

今日复习到这里，明日继续，加油！补充：花括号在代码中的使用。补充：花括号在代码中的使用。

2025-06-06 17:37:48 293

原创 Python Day42 学习（日志Day9复习）

箱体越高，数据越分散；箱体越矮，数据越集中。箱体高度可以帮助你判断该类别下数据的离散程度。补充：关于“小提琴图”的阅读。

2025-06-05 17:00:37 802

原创 Python Day41学习（日志Day8复习）

重写代码时出现的问题：.tolist()是一个方法对象，调用时须加()。刚开始书写时漏掉了()，导致报错。

2025-06-03 22:30:43 273

原创 Python Day40 学习(复习学习日志Day5-7)

自己写的时候，还是出现了问题：首先是忘记了要定义一下data, 通过data =pd.read_csv('data.csv')可以将读取到的数据保存到变量data中，方便后续进行数据分析。其次，是漏掉了这行代码的作用是：把DataFrame的所有列名提取出来，转换成一个列表，赋值给变量c。得到的是一个包含所有列名的Index对象。.tolist()方法把这个Index对象转换成普通的Python列表。这样，c。这样做的好处是，后面可以用来遍历每一列，方便批量处理每一列的数据。

2025-06-02 16:29:18 379

原创 Python Day39 学习（复习日志Day4）

今日复习了日志Day4的内容，感觉还是得在纸上写一写印象更深刻，接下来几日都采取“纸质化复习过往日志”和“电脑上重敲代码自检”结合的方式复习，明日继续，加油！补充：如何判断是用“众数”还是“中位数”填补空缺值？补充: 关于“类”和“类的实例”的通俗易懂的例子。复习Day4日志内容。复习Day4日志内容。

2025-06-01 22:01:18 391

原创 Python Day38 学习

继续昨日的内容学习一下两种机制：try-except机制和try-except-else-finally机制。

2025-05-31 16:56:14 411

原创 Python Day37 学习

（补充学习几个知识点）摘自讲义。

2025-05-30 17:45:23 422

原创 Python Day36 学习

浙大疏锦行摘自讲义。

2025-05-29 16:13:33 2063

原创 Python Day35 学习

继续元组和OS模块的学习。

2025-05-28 12:55:47 500

原创 Python Day34 学习

今日内容通过“心脏病数据集”对之前的内容进行复习，再进行新内容“元组和OS模块”的学习。

2025-05-27 16:37:49 489

原创 Python Day33 学习

这类算法在降维过程中不使用任何关于数据样本的标签信息（比如类别标签、目标值等）。它们仅仅根据数据点本身的分布、方差、相关性、局部结构等特性来寻找低维表示。

2025-05-26 17:23:52 643

原创 Python Day32 学习

今天学习讲义Day20的内容。

2025-05-25 11:35:07 860

原创 Python Day31 学习

Q. 关于“过拟合”？简单来说就是模型学得太死板，只会记住训练数据，遇到新数据就不会做出正确判断。代码实现。

2025-05-24 11:12:34 570

原创 Python Day30 学习

今日进行讲义Day19内容的学习。

2025-05-23 22:36:41 618

原创 Python Day29 学习

特征总结：在债务合并用途上表现一致，几乎无破产记录，信用问题极少，资金用途集中且很少涉及特殊类别。财务状况稳定，信用良好，资金流向明确。定义依据：各项关键财务和信用指标表现优异，显示出良好的财务自律性和信用履约能力，所以定义为 “优质信用稳健财务型”。

2025-05-22 12:49:26 662

原创 Python Day28 学习

DBSCAN聚类Q1. 该算法的原理是什么？总体而言，DBSCAN聚类是一种基于密度的聚类算法，适合发现任意形状的簇和检测噪声点Q2. 代码实现打印结果代码继续（绘制评估指标图）代码继续（进行聚类）从聚类的结果来看，这次聚类失败，因为没有少数簇的数目太少。对此，提出问题：Q3. 如何判断DBSCAN聚类是否成功？(除了聚类评估指标外）

2025-05-21 17:29:06 525

原创 Python Day27 学习

本质上就是一种分组分类。

2025-05-20 22:17:21 625

原创 Python Day26 学习

继续NumPy的学习。

2025-05-19 21:43:41 1224 4

原创 Python Day25 学习

数组的随机化创建指的是利用NumPy等工具生成包含有随机数的数组。这些数组的元素并非是手动指定的，而是由随机数生成器自动生成的。NumPy数组支持“向量化”操作，可以直接对整个数组加1，优势明显。今日学习到这里，得补充线性代数的知识了（苦笑）。明日继续“数组索引”的学习，进度是快不了一点，还是慢慢来吧，加油，加油！注：rand()与random()都是均匀分布，但rand()能直接生成数组。注：这部分代码的作用是把一个数组中的每个元素都加1，然后计算所有元素的总和。代码示例：计算两个数组的和、差、除法。

2025-05-14 22:33:07 503

原创 Python Day 24 学习

NumPy数组可以是一维、二维或更高维的数组。一维数组类似Python列表，二维数组类似矩阵，三维及以上数组可以表示更复杂的数据结构。如概念所示，NumPy数组中的所有元素必须是相同的数据类型。注意这里须与Python中的列表进行区分（列表可以包含不同类型的元素）。它是用于数值计算的核心数据结构，能够高效地存储和操作大量的。NumPy数组在内存中是连续存储的，计算效率比Python列表高。今日学习到这里，明天继续NumPy数组的学习。NumPy数组是Python中由NumPy库提供的一种。

2025-05-13 22:25:21 654

原创 Python Day23 学习

特征重要性蜂巢图是 SHAP 的全局解释工具，通过展示每个特征的 SHAP 值分布，帮助我们理解特征对模型预测的影响大小、方向和分布情况。特征重要性条形图（Feature Importance Bar Plot）是 SHAP 提供的一种全局解释工具，用于展示模型中各个特征对预测结果的重要性。：表示特征的重要性，通常是特征的 SHAP 值的平均绝对值（`mean(|SHAP value|)`）。- SHAP 值的绝对值越大，说明该特征对模型预测的影响越大。SHAP 值，表示特征对模型预测的影响大小和方向。

2025-05-12 21:45:04 2408

空空如也

空空如也