自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 DAY 11 常见的调参方式

对于信贷数据的其他模型,如LightGBM和KNN 尝试用下贝叶斯优化和网格搜索。贝叶斯优化(2种实现逻辑,以及如何避开必须用交叉验证的问题)随机搜索(简单介绍,非重点 实战中很少用到,可以不了解)time库的计时模块,方便后人查看代码运行时长。DAY 11 常见的调参方式。

2025-06-18 18:56:23 188

原创 DAY 10 机器学习建模与评估

今日代码比较多,但是难度不大,仔细看看示例代码,好好理解下这几个评估指标。训练集形状:(6000, 31),测试集的形状:(1500, 31)尝试对心脏病数据集采用机器学习模型建模和评估。DAY 10 机器学习建模与评估。机器学习模型建模的三行代码。机器学习模型分类问题的评估。F1分数:0.5035。准确率:0.7060。精确率:0.0000。召回率:0.0000。

2025-06-17 06:35:10 653

原创 DAY 9 热力图和子图的绘制

尝试对着心脏病数据集绘制热力图和单特征分布的大图(包含几个子图)DAY 9 热力图和子图的绘制。知识点:热力图和子图的绘制。enumerate()函数。介绍了热力图的绘制方法。介绍了子图的绘制方法。

2025-06-12 19:44:14 225

原创 DAY 8 标签编码与连续变量处理

作业:对心脏病数据集的特征用上述知识完成,一次性用所有的处理方式完成预处理,尝试手动完成,多敲几遍代码。# DAY 8 标签编码与连续变量处理。# ●连续特征的处理:归一化和标准化。# 至此,常见的预处理方式都说完了。# 知识点见示例代码。# ●字典的简单介绍。

2025-06-03 00:25:38 242

原创 DAY 7 复习日

每隔7天是一次复习日,让之前的同学补上进度,也留给你巩固知识的机会。# 针对之前学到的所有知识,针对心脏病项目的数据集来完成数据的预处理。# (我们暂时还没说到标签编码、连续变量处理,所以可以忽略)# DAY 7 复习日。

2025-06-01 17:08:36 221

原创 DAY 6 描述性统计

去针对其他特征绘制单特征图和特征和标签的关系图,并且试图观察出一些有意思的结论。单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图。内容回顾:数据初步可视化。箱线图美化--->直方图。DAY 6 描述性统计。特征和标签关系可视化。

2025-05-31 00:13:44 357

原创 DAY 5 独热编码

注意:这里区分离散变量仅仅通过object类型,实际中还需要结合对数据的认识,这里为了方便没有考虑现实意义。注意是py文件中,所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。现在在py文件中 一次性处理data数据中所有的连续变量和离散变量。注意此时你可以借助下面的调试控制台 来进行值的查看。3. 对独热编码后的变量转化为int类型。先按照示例代码过一遍,然后完成下列题目。2. 对离散变量进行one-hot编码。题目:离散特征的独热编码。1. 读取data数据。对所有缺失值进行填充。

2025-05-28 23:05:26 275

原创 DAY 4 缺失值的处理

完成后在py文件中独立完成一遍,并且利用debugger工具来查看属性(不借助函数显式查看)----养成利用debugger工具的习惯。按照示例代码的要求,去尝试补全信贷数据集中的数值型缺失值。题目:初识pandas库与缺失数据的补全。打开数据(csv文件、excel文件)查看数据(尺寸信息、查看列名等方法)利用循环补全所有列的空值。众数、中位数填补空值。

2025-05-28 00:17:48 124

原创 DAY 3 列表、循环和判断语句

创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"

2025-05-25 13:33:25 358

原创 DAY 2 字符串与比较运算

题目: 定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。题目: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。

2025-05-25 01:09:27 346

原创 Python打卡 Day 1

● 题目: 定义两个浮点数变量,price 赋值为 19.9,discount 赋值为 0.8 (表示 8 折)。●题目: 定义两个整数变量,num1 赋值为 20,num2 赋值为 8。计算这两个变量的和,并将结果存储在一个新的变量 a 中;计算这两个变量的余数,叫做c。●题目: 创建两个变量:name 存储你的名字(字符串,例如 "小明"),city 存储你所在的城市(字符串,例如 "北京")。●如果想在输出的姓名两边加上引号,例如 姓名: "小明", 城市: 北京,f-string 语句应该怎么写?

2025-05-25 00:21:13 452

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除