- 博客(11)
- 收藏
- 关注
原创 DAY 11 常见的调参方式
对于信贷数据的其他模型,如LightGBM和KNN 尝试用下贝叶斯优化和网格搜索。贝叶斯优化(2种实现逻辑,以及如何避开必须用交叉验证的问题)随机搜索(简单介绍,非重点 实战中很少用到,可以不了解)time库的计时模块,方便后人查看代码运行时长。DAY 11 常见的调参方式。
2025-06-18 18:56:23
188
原创 DAY 10 机器学习建模与评估
今日代码比较多,但是难度不大,仔细看看示例代码,好好理解下这几个评估指标。训练集形状:(6000, 31),测试集的形状:(1500, 31)尝试对心脏病数据集采用机器学习模型建模和评估。DAY 10 机器学习建模与评估。机器学习模型建模的三行代码。机器学习模型分类问题的评估。F1分数:0.5035。准确率:0.7060。精确率:0.0000。召回率:0.0000。
2025-06-17 06:35:10
653
原创 DAY 9 热力图和子图的绘制
尝试对着心脏病数据集绘制热力图和单特征分布的大图(包含几个子图)DAY 9 热力图和子图的绘制。知识点:热力图和子图的绘制。enumerate()函数。介绍了热力图的绘制方法。介绍了子图的绘制方法。
2025-06-12 19:44:14
225
原创 DAY 8 标签编码与连续变量处理
作业:对心脏病数据集的特征用上述知识完成,一次性用所有的处理方式完成预处理,尝试手动完成,多敲几遍代码。# DAY 8 标签编码与连续变量处理。# ●连续特征的处理:归一化和标准化。# 至此,常见的预处理方式都说完了。# 知识点见示例代码。# ●字典的简单介绍。
2025-06-03 00:25:38
242
原创 DAY 7 复习日
每隔7天是一次复习日,让之前的同学补上进度,也留给你巩固知识的机会。# 针对之前学到的所有知识,针对心脏病项目的数据集来完成数据的预处理。# (我们暂时还没说到标签编码、连续变量处理,所以可以忽略)# DAY 7 复习日。
2025-06-01 17:08:36
221
原创 DAY 6 描述性统计
去针对其他特征绘制单特征图和特征和标签的关系图,并且试图观察出一些有意思的结论。单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图。内容回顾:数据初步可视化。箱线图美化--->直方图。DAY 6 描述性统计。特征和标签关系可视化。
2025-05-31 00:13:44
357
原创 DAY 5 独热编码
注意:这里区分离散变量仅仅通过object类型,实际中还需要结合对数据的认识,这里为了方便没有考虑现实意义。注意是py文件中,所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。现在在py文件中 一次性处理data数据中所有的连续变量和离散变量。注意此时你可以借助下面的调试控制台 来进行值的查看。3. 对独热编码后的变量转化为int类型。先按照示例代码过一遍,然后完成下列题目。2. 对离散变量进行one-hot编码。题目:离散特征的独热编码。1. 读取data数据。对所有缺失值进行填充。
2025-05-28 23:05:26
275
原创 DAY 4 缺失值的处理
完成后在py文件中独立完成一遍,并且利用debugger工具来查看属性(不借助函数显式查看)----养成利用debugger工具的习惯。按照示例代码的要求,去尝试补全信贷数据集中的数值型缺失值。题目:初识pandas库与缺失数据的补全。打开数据(csv文件、excel文件)查看数据(尺寸信息、查看列名等方法)利用循环补全所有列的空值。众数、中位数填补空值。
2025-05-28 00:17:48
124
原创 DAY 3 列表、循环和判断语句
创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"
2025-05-25 13:33:25
358
原创 DAY 2 字符串与比较运算
题目: 定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。题目: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。
2025-05-25 01:09:27
346
原创 Python打卡 Day 1
● 题目: 定义两个浮点数变量,price 赋值为 19.9,discount 赋值为 0.8 (表示 8 折)。●题目: 定义两个整数变量,num1 赋值为 20,num2 赋值为 8。计算这两个变量的和,并将结果存储在一个新的变量 a 中;计算这两个变量的余数,叫做c。●题目: 创建两个变量:name 存储你的名字(字符串,例如 "小明"),city 存储你所在的城市(字符串,例如 "北京")。●如果想在输出的姓名两边加上引号,例如 姓名: "小明", 城市: 北京,f-string 语句应该怎么写?
2025-05-25 00:21:13
452
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅