自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 PYTHON打卡DAY14

除了ipynb文件里给的两个图的代码,其他图都跑不出来。

2025-05-29 22:32:00 121

原创 PYTHON打卡DAY13

从示例代码可以看到 效果没有变好,所以很多步骤都是理想是好的,但是现实并不一定可以变好。这个实验仍然有改进空间,如下。1. 我还没做smote+过采样+修改权重的组合策略,有可能一起做会变好。2. 我还没有调参,有可能调参后再取上述策略可能会变好。不平衡数据集的处理策略:过采样、修改权重、修改阈值。

2025-05-27 23:46:32 164

原创 #PYTHON打卡DAY2

今天依然是PYTHON基础知识。

2025-05-16 23:27:39 156

原创 #PYTHON训练营打卡DAY1

PS:之前的训练营没有坚持下去,今天开始重开~

2025-05-15 21:56:31 262

原创 PYTHON训练营打卡DAY12

超参数调整专题2三种启发式算法的示例代码:遗传算法、粒子群算法、退火算法学习优化算法的思路(避免浪费无效时间)作业:今天以自由探索的思路为主,尝试检索资料、视频、文档,用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑,帮助更深入的理解。

2025-05-05 23:35:06 192

原创 PYTHON训练营打卡DAY11补充

之前的代码一直报错。

2025-05-05 00:37:14 111

原创 PYTHON训练营打卡DAY11

对于信贷数据的其他模型,如LightGBM和KNN 尝试用下贝叶斯优化和网格搜索。贝叶斯优化(2种实现逻辑,以及如何避开必须用交叉验证的问题)随机搜索(简单介绍,非重点 实战中很少用到,可以不了解)time库的计时模块,方便后人查看代码运行时长。

2025-05-04 23:58:56 236 4

原创 PYTHON训练营DAY10机器学习建模与评估

AUC是基于不同阈值得到不同的混淆矩阵,然后计算每个阈值对应FPR和TPR,讲这些点连成线,最后求曲线下的面积,得到AUC值。今日代码比较多,但是难度不大,仔细看看示例代码,好好理解下这几个评估指标。- 基于混淆矩阵,计算准确率、召回率、F1值,这些都是固定阈值的评估指标。测试集的预测值和测试集的真实值进行对比,得到混淆矩阵。尝试对心脏病数据集采用机器学习模型建模和评估。3. 模型预测 (代入测试集)2. 模型训练(代入训练集)机器学习模型建模的三行代码。机器学习模型分类问题的评估。

2025-05-03 22:50:47 241

原创 PYTHON训练营打卡DAY9

尝试对着心脏病数据集绘制热力图和单特征分布的大图(包含几个子图)2.介绍了enumerate()函数。2.绘制心脏病数据集单特征分布的大图。1.绘制心脏病数据集的热力图。1.介绍了热力图的绘制方法。3.介绍了子图的绘制方法。

2025-05-03 11:19:57 230

原创 PYTHON训练营打卡DAY8

将心脏病数据集的‘testbps’列做归一化处理。连续特征的处理:归一化和标准化。

2025-05-02 19:16:36 188

原创 PYTHON训练营打卡DAY7

针对之前学到的所有知识,针对心脏病项目的数据集来完成数据的预处理。(我们暂时还没说到标签编码、连续变量处理,所以可以忽略)

2025-05-01 23:59:34 116

原创 PYTHON训练营打卡DAY6

作业:去针对其他特征绘制单特征图和特征和标签的关系图,并且试图观察出一些有意思的结论。1.单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图。3.箱线图美化--->直方图。2.特征和标签关系可视化。

2025-04-28 09:13:26 270

原创 PYTHON打卡训练营DAY5代码补充

【代码】PYTHON打卡训练营DAY5代码补充。

2025-04-28 00:49:04 136

原创 PYTHON打卡训练营DAY5

可以鼠标悬停来查看每个函数的参数,这里采用了类型注解写法,可以看到每个参数的要求类型,同时可以看到参数的默认值,如果没有默认值就是必填参数。注意:这里区分离散变量仅仅通过object类型,实际中还需要结合对数据的认识,这里为了方便没有考虑现实意义。注意是py文件中,所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。可以看到所有类似的数据处理流程都是一致的。现在在py文件中 一次性处理data数据中所有的连续变量和离散变量。注意此时你可以借助下面的调试控制台 来进行值的查看。

2025-04-27 23:58:23 570

原创 PYTHON训练营打卡DAY4

完成后在py文件中独立完成一遍,并且利用debugger工具来查看属性(不借助函数显式查看)----养成利用debugger工具的习惯。心得:day3---->day4 学习了库和表格的调用,缺失值的填充。按照示例代码的要求,去尝试补全信贷数据集中的数值型缺失值。打开数据(csv文件、excel文件)查看数据(尺寸信息、查看列名等方法)初识pandas库与缺失数据的补全。利用循环补全所有列的空值。众数、中位数填补空值。

2025-04-25 23:43:48 134

原创 PYTHON打卡训练营DAY3

创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"

2025-04-22 19:02:27 741

原创 PYTHON打卡训练营DAY2

题目: 定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。题目: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。

2025-04-21 16:29:24 127

原创 PYTHON训练营打卡DAY1

计算这两个变量的和,并将结果存储在一个新的变量 a 中;计算这两个变量的商,叫做b;计算这两个变量的余数,叫做c。然后,使用 f-string 打印出类似 “20 加 8 的结果是:28” 的信息,分成三行打印。计算折扣后的价格,并将结果存储在变量。和 f-string,如何让姓名和城市分两行输出?函数将每个变量的值单独打印出来,每个值占一行。如果想在输出的姓名两边加上引号,例如。计算节省了多少钱,存储在变量。存储你所在的城市(字符串,例如。存储你的名字(字符串,例如。定义两个浮点数变量,

2025-04-21 16:20:24 498

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除