lxk66678-优快云博客

原创 Python打卡DAY11

1. 导入库筛选离散特征对离散特征进行标签编码独热编码以及缺失值的中位数补全。3.由于许多函数自带交叉验证所以如果想不交叉比较麻烦只需划分一次训练集与测试集。purpose独热编码的具体理解前几天没搞懂。这里time函数用于计时import time。5.针对lightgbm自己试着进行调参。可以看见val 和test 均占10%2.划分训练集验证集测试集的方法。4. 导入随机森林并进行调参。

2025-07-19 18:07:31 376

6000，17的意思是6000个样本 17个特征这里以8：2的形式划分了训练集与测试集。今日代码比较多，但是难度不大，仔细看看示例代码，好好理解下这几个评估指标。尝试对心脏病数据集采用机器学习模型建模和评估。2. 读取数据查看数据信息--理解数据。DAY 10 机器学习建模与评估。五.对心脏病数据集进行训练与测试。机器学习模型建模的三行代码。机器学习模型分类问题的评估。二.划分训练集与测试集。处理object数据。四.模型的训练与测试。

2025-07-17 22:49:12 429

原创 Python打卡DAY9

使用循环实现刚才的坐标形式可以简化代码这里row col 会从0，0 变成1，1 一个意思。7.enumerate()函数可返回迭代对象。6. 以坐标的形式绘制四个特征的箱线图。可以看到object变成了int型。4.将上面的字符串映射为数字。2. 查看前五行数据。

2025-07-12 23:33:57 285

原创 Python打卡DAY8

之前提到离散数据如果是不存在顺序，则采用独热编码，函数为pd.get_dummies()。按照贷款严重程度来进行标签编码这里也可以用独热编码。值就是Alice 30 和New York 相对应。前面几行是函数的内容最后打印数值归一化后的效果。3.对annual income做归一化处理。那么存在大小和顺序的离散特征则采用标签编码。即自有房小于租房小于有其他贷款小于有房贷。同时对两个特征进行标签编码做一个嵌套。继续完成对心脏病数据集的预处理。1.字典用于储存键值对。二分类问题的标签编码。

2025-07-11 22:17:43 348

原创 Python打卡DAY7

今天复习又重新复习了一遍复试班的内容收获颇丰感恩！还有许多不足继续学习。DAY7 复习日针对上周学过知识对心脏病数据集进行预处理。性别分布直方图（问ai的）

2025-07-07 23:57:52 150

原创 Python打卡DAY6

8.由于离散变量Number of Open Accounts 有多个变量绘制其与标签Credit Default关系的横坐标会挤在一起需要在代码中进行分组。plt.rcParams['font.sans-serif'] = ['SimHei'] 可设置全局字体支持中文。plt.rcParams['axes.unicode_minus'] = False 解决负号变成方块。6.针对离散标签连续特征绘制箱线图 Credit Default 分为0与1 即违约和不违约。DAY6任务学习数据可视化。

2025-07-06 22:54:26 399

原创 Python打卡DAY5

可以看到变成了该列名_Rent 或_Own Home 等添加了下划线。现在在py文件中一次性处理data数据中所有的连续变量和离散变量。5.查看一下转换后的数据类型，并将bool型转为int型。3. 对独热编码后的变量转化为int类型。2.打印一下Home Ownership。2. 对离散变量进行one-hot编码。转换一下类型将bool型转为int型。6.一次性对所有离散特征进行独热编码。7.难点-如何找到被独热编码的列名。题目：离散特征的独热编码。4.对该列进行独热编码。DAY 5 独热编码。

2025-07-05 21:22:21 160

lxk66678的博客

原创 Python打卡DAY12

原创 Python打卡DAY11

原创 Python打卡DAY10

原创 Python打卡DAY9

原创 Python打卡DAY8

原创 Python打卡DAY7

原创 Python打卡DAY6

原创 Python打卡DAY5

原创 Python打卡DAY4

原创 Python打卡DAY3

原创 Python打卡DAY2

原创 Python打卡DAY1

空空如也

空空如也