- 博客(6)
- 收藏
- 关注
原创 先贤显现Day6:数据可视化
sns.countplot(x='Open Accounts Group',hue='Credit Default',data=data) #countplot计数图。去针对其他特征绘制单特征图和特征和标签的关系图,并且试图观察出一些有意思的结论。实际在研究离散特征与离散标签关系时也可用计数条形图(countplot)单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图。思考:观察不同特征在各个标签类别下的分布有何不同。箱线图美化--->直方图。特征和标签关系可视化。
2025-11-17 16:26:32
255
原创 先贤显现Day4:缺失值的处理
完成后在py文件中独立完成一遍,并且利用debugger工具来查看属性(不借助函数显式查看)----养成利用debugger工具的习惯。:Index对象有特定的方法,比如.tolist()获取数据后查看缺失值数值列有哪些,并计算缺失值总和。打开数据(csv文件、excel文件)查看数据(尺寸信息、查看列名等方法)返回的是pandas的Index对象。初识pandas库与缺失数据的补全。尝试补全信贷数据集中的数值型缺失值。:确保不会漏掉任何需要处理的列。利用循环补全所有列的空值。利用循环补全所有列的空值。
2025-11-11 10:20:03
836
原创 先贤显现Day3:列表、循环和判断语句
range(start, stop, step) # 从 start 开始,步长为 step,到 stop-1。eg.for char in "Python" #字符串--逐个取出每个字符 #P,y,t,h,o,n。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。range(start, stop) # 从 start 开始到 stop-1。和错误1是一个思路,这里应该加的是次数1,而不是在[1]这个范围内一直叠加。
2025-11-07 22:40:07
609
原创 先贤显现Day2:字符串操作与比较运算
不能直接password和min_length比较,一个是字符串一个是数字,记得先用len计算password的长度。定义两个字符串变量,str1 赋值为 "Hello",str2 赋值为 "Python"。将这两个字符串拼接起来(中间加一个空格),存储在变量 greeting 中。计算 greeting 字符串的长度,存储在变量 length 中。提取中间的5个字符(nProg),存储在变量 middle 中。将 score 转换为字符串,存储在 score_str 中。
2025-11-06 11:24:54
903
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅