自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 PythonDay10打卡

机器学习建模与评估知识点:1.数据集的划分2.机器学习模型建模的三行代码3.机器学习分类问题的评估作业:对心脏病数据集采用机器学习模型建模和评估预处理完整代码:机器学习代码: 输出的结果是:输出的结果是: 输出的结果是: 输出的结果是: 输出的结果是: 输出的结果是:输出的结果是:打印表格: @浙大疏锦行

2025-04-29 17:40:20 265 1

原创 PythonDay9打卡

作业:对心脏病数据集绘制热力图和单特征分布的大图(包含几个子图)1.读取数据+查看数据。

2025-04-28 22:27:10 364 1

原创 PythonDay8打卡

数据是经过**归一化(Min-Max Normalization)**处理后的结果,这种归一化通常将数据缩放到[0,1]范围。1. 数值范围 :所有值都在0-1之间(如0.166~0.885),符合Min-Max归一化的预期。1. 均值为0 :所有列的mean值接近0(如 age 列的4.69e-17)- sex → sex_1 (二分类,drop_first后保留1列)- cp → cp_1 , cp_2 , cp_3 (四分类变三列)- 每个分类变量被展开为多列(如cp→cp_1,cp_2,cp_3)

2025-04-27 21:27:37 1718 2

原创 PythonDay7打卡

输出的结果是:输出的结果是:查看预处理后的数据查看预处理前的数据。

2025-04-26 16:56:38 344 1

原创 Python打卡Day6

数据初步可视化内容回顾:单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图特征和标签关系可视化箱线图美化--->直方图作业:去针对其他特征绘制单特征图和特征和标签的关系图,并且试图观察出一些有意思的结论输出的结果是一样的。两种方法选择推荐情况:- 简单筛选时推荐使用 select_dtypes ,更简洁高效- 需要复杂条件判断时可以使用循环方式- 如果数据量很大, select_dtypes 的性能优势会更明显第一步:导入三个常用数据分析可视化库。

2025-04-25 15:19:23 1360 1

原创 Python打卡Day5

独热编码是把"猫/狗/鸟"这样的文字变成"是否猫(1/0)","是否狗(1/0)","是否鸟(1/0)"多个列。注意是py文件中,所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。现在在py文件中 一次性处理data数据中所有的连续变量和离散变量。1. 找出所有文本列并进行独热编码(变成多个0/1的列)处理缺失值就像填空考试,不知道答案就填个平均分。3. 对独热编码后的变量转化为int类型。先按照示例代码过一遍,然后完成下列题目。3. 用平均值填充所有缺失值。4.对所有缺失值进行填充。

2025-04-24 20:39:21 238 1

原创 Python打卡Day4

注:print("\n前5行数据:") 和 print(data.head()) 是一个完整的查看数据前5行的步骤。- df[column].isnull().sum() > 0 :统计该列缺失值数量,大于0表示有缺失。- 需要使用完整路径,如: data = pd.read_csv('D:/我的文档/data.csv')- Counter().most_common(1)[0][0] :计算出现次数最多的值(众数)2.读取数据文件 ( pd.read_csv('data.csv') )

2025-04-23 12:09:02 669 1

原创 Day3打卡

3. sum_result += i :每次循环将当前i的值加到sum_result上(相当于sum_result = sum_result + i)- 添加了"JavaScript" → 变成 ["Python","Java","Go","JavaScript"]- 修改了第二个元素 → 变成 ["Python","Ruby","Go","JavaScript"]使用 if 语句判断当前分数是否大于等于 90。- 移除了"Go" → 最终变成 ["Python","Ruby","JavaScript"]

2025-04-22 12:36:10 1432 1

原创 Day2打卡

比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;变量名 str1 中的"str"是"string"(字符串)的缩写,数字1表示这是第一个字符串变量。1. 由三部分拼接组成: str1 ("Hello") + 空格(" ") + str2 ("Python")是一个字符串变量,它存储了 greeting 字符串的第一个字符。

2025-04-21 10:07:14 559 1

原创 Day1练习

然后,使用 f-string 打印出类似 “20 加 8 的结果是:28” 的信息,分成三行打印。注:print() 是 Python 中的一个内置函数,用于将内容输出到标准输出(通常是控制台/终端)。输出的姓名两边加上引号,例如 姓名: "小明", 城市: 北京,f-string 语句写法。这段代码使用了Python的f-string格式化字符串功能,可以更简洁地实现多行输出。1. f"..." 表示这是一个f-string(格式化字符串字面量)f"节省金额是: {saved_amount:.2f}")

2025-04-20 22:14:06 668 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除