自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 Python 学习日记 day28

当解释器遇到像 def, class, if, for 这样的语句,并且后面跟着冒号 : 时,它就期望接下来会有一个或多个缩进的语句来构成这个代码块。如果它没有找到任何缩进的语句(即代码块是空的),它就无法确定这个结构的范围,因此会抛出 IndentationError。所以,当你需要一个语法上存在的代码块,但又暂时不想在其中放入任何实际的逻辑时,pass 就是一个完美的占位符,它告诉解释器:“这里有一个代码块,但它什么也不做。初始化方法又叫构造方法、特殊方法。## 类的初始化方法。

2025-05-27 22:31:32 332

原创 Python 学习日记 day27

下面这个函数实现的是计算2到9999的所有质数(在大于 1 的自然数中,除了 1 和它自身外,不能被其他自然数整除的数),并且打印找到这些数需要的时间。会发现,这个time模块让整个代码逻辑很混乱,因为函数的主体是找质数,time模块是找质数的时间,如果可以time模块放在函数外,这样逻辑才清晰。2. 定义一个函数,循环2到9999的数,通过判断质数函数来筛选每个数。3. 在函数中通过time模块进行记时。1. 定义一个判断是否为质数。

2025-05-26 23:03:44 233

原创 Python 学习日记 day26

封装可重复使用的代码块,提高代码复用性。

2025-05-25 22:00:56 2187

原创 Python 学习日记 day25

如果找到匹配的,则执行该 except 块中的代码,然后继续执行整个 try-except 结构之后的代码(除非 except 块中又引发了新异常或执行了 return/break/continue 等)。如果未找到匹配的 except 块,异常会向上传播。如果 try 失败:try 块中出错前的代码会执行,然后匹配的 except 块的代码会执行(else 块不会执行)。- except: 如果try块中的代码确实引发了特定类型的异常(或者任何异常,如果未指定类型),则执行此代码块。

2025-05-24 23:17:07 645

原创 Python 学习日记 day24

很多流行的 ML/DL 库(如 TensorFlow, PyTorch, NumPy)在其 API 中都广泛使用了元组来表示形状、配置等。2. 元组中的元素不能修改,这一点非常重要,深度学习场景中很多参数、形状定义好了确保后续不能被修改。可以看到,元组最重要的功能是在列表之上,增加了不可修改这个需求。1. 有序,可以重复,这一点和列表一样。

2025-05-23 20:00:34 201

原创 Python 学习日记 day23

转换器(transformer)是一个用于对数据进行预处理和特征提取的 estimator,它实现一个 transform 方法,用于对数据进行预处理和特征提取。在管道机制中,可以使用Pipeline类来组织和连接不同的转换器和估计器。之所以提到管道,是因为后续你在阅读一些经典的代码的时候,尤其是官方文档,非常喜欢用管道来构建代码,甚至深度学习中也有类似的代码,初学者往往看起来很吃力。在机器学习中,通常会按照一定的顺序对数据进行预处理、特征提取、模型训练和模型评估等步骤,以实现机器学习模型的训练和评估。

2025-05-21 21:55:04 688

原创 Python 学习日记 day22

通过遵循以上注意事项,可高效利用Kaggle平台进行数据科学实践,同时避免常见错误。建议从简单任务入手,逐步积累经验,结合社区资源快速提升技能。

2025-05-20 21:42:07 1947

原创 Python 学习日记 day21

t-SNE 是一种强大的非线性降维技术,主要用于高维数据的可视化。它通过在低维空间中保持高维空间中数据点之间的局部相似性(邻域关系)来工作。与PCA关注全局方差不同,t-SNE 更关注局部细节。理解它的超参数(尤其是困惑度)和结果的正确解读方式非常重要。

2025-05-19 20:18:55 1864

原创 Python 学习日记 day20

【代码】Python 学习日记 day20。

2025-05-18 21:07:22 186

原创 Python 学习日记 day19

皮尔逊相关系数筛选是一种基于特征与目标变量之间相关性的特征选择方法。它的核心逻辑是:计算每个特征与目标变量之间的相关系数(范围在-1到1之间,值越大表示正相关越强,值越小表示负相关越强,接近0表示几乎无关),然后根据相关系数的绝对值大小,选择与目标变量相关性较高的特征,剔除相关性较低的特征。它的核心逻辑是:特征的方差反映了数据的变化程度,方差很小的特征几乎没有变化,对模型的预测帮助不大。因此,方差筛选会设定一个方差阈值,剔除方差低于这个阈值的特征,保留那些变化较大的特征,从而减少特征数量,提高模型效率。

2025-05-16 20:13:18 360

原创 Python 学习日记 day18

最开始聚类的时候,就选择了你想最后用来确定簇含义的特征,那么你需要选择一些特征来进行聚类,那么你最后确定簇含义的特征就是这几个特征,而非全部。如你想聚类消费者购买习惯,那么他过去的消费记录、购买记录、购买金额等等,这些特征都与消费者购买习惯有关,你可以使用这些特征来确定簇含义,一些其他的特征,如消费者年龄,工作行业则不考虑。最开始用全部特征来聚类,把其余特征作为 x,聚类得到的簇类别作为标签构建监督模型,进而根据重要性筛选特征,来确定要根据哪些特征赋予含义。---使用于你想构造什么,目前还不清楚。

2025-05-15 22:25:34 345

原创 Python 学习日记 day17

@浙大疏锦行以下是三种常用的聚类效果评估指标,分别用于衡量聚类的质量和簇的分离与紧凑程度:KMeans 是一种基于距离的聚类算法,需要预先指定聚类个数,即 。其核心步骤如下:层次聚类Agglomerative Clustering 是一种自底向上的层次聚类方法,初始时每个样本是一个簇,然后逐步合并最相似的簇,直到达到指定的簇数量或满足停止条件。由于它需要指定簇数量(类似于 KMeans),我将通过测试不同的簇数量 n_clusters 来评估聚类效果,并使用轮廓系数(Silhouette Score)、CH

2025-05-14 21:52:21 955

原创 Python 学习日记 day16

在后续进行频繁的数学运算时,尤其是在深度学习领域,对 NumPy 数组的理解非常有帮助,因为 PyTorch 或 TensorFlow 中的。的 NumPy 数组。掌握 NumPy 的基本操作,能极大地降低学习 Tensor 的门槛。关于 NumPy 更深入的性质,我们留待后续探讨。二维数组可以被看作是“数组的数组”或者一个矩阵。是正方形(即行数等于列数),它可以是任意的。的概念,与我们日常理解的维度非常相似。来创建新的 NumPy 数组。,甚至其他的 NumPy。值得注意的是,二维数组。

2025-05-13 20:35:44 609

原创 Python 学习日记 day15

【代码】Python 学习日记 day15。

2025-05-12 21:58:23 240

原创 Python 学习日记 day14

理解复杂机器学习模型(尤其是“黑箱”模型,如随机森林、梯度提升树、神经网络等)为什么会对特定输入做出特定预测。SHAP 提供了一种统一的方法来解释模型的输出。核心思想:合作博弈论中的 Shapley 值SHAP (SHapley Additive exPlanations) 的核心基于博弈论中的Shapley 值概念。模型的特征 (Features)就是玩家。目标是预测某个样本的输出值。不同的特征子集可以“合作”起来进行预测。某个特征子集进行预测得到的值。如何公平地。

2025-05-11 21:44:37 581

原创 Python 学习日记 day13

【代码】Python 学习日记 day13。

2025-05-10 21:22:44 191

原创 Python 学习日记 day12

算法核心机制优势局限性遗传算法交叉变异 + 自然选择全局搜索强,易并行化参数敏感,可能早熟收敛模拟退火算法温度控制 + 概率接受劣质解避免局部最优,鲁棒性强收敛较慢,参数调节复杂。

2025-05-09 20:13:11 447

原创 Python 学习日记 day11

【代码】Python 学习日记 day11。

2025-05-08 18:57:03 168

原创 Python 学习日记 day10

【代码】Python 学习日记 day10。

2025-05-06 22:29:23 215

原创 Python 学习日记 day9

【代码】Python 学习日记 day9。

2025-05-05 00:34:19 162

原创 Python 学习日记 day8

【代码】Python 学习日记 day8。

2025-04-30 21:35:24 129

原创 Python 学习日记 day7

【代码】Python 学习日记 day7。

2025-04-29 23:01:32 143

原创 Python 学习日记 day6

【代码】Python 学习日记 day6。

2025-04-28 22:51:50 210

原创 Python 学习日记 day5

【代码】Python 学习日记 day4。

2025-04-25 23:33:23 156

原创 Python 学习日记 4

【代码】Python 学习日记 4。

2025-04-24 22:43:44 248

原创 Python 学习日记

【代码】Python 学习日记。

2025-04-23 23:39:50 222

原创 Python学习日记

【代码】Python学习日记。

2025-04-22 18:50:12 184

原创 Python 学习日记

【代码】Python 学习日记。

2025-04-22 00:06:42 181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除