- 博客(5)
- 收藏
- 关注
原创 练习题综合打卡
#练习一: 各部门工资最高的员工(难度:中等)#创建Employee 表,包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。CREATE TABLE Employee(Employee_id CHAR(4) NOT NULL ,Name VARIANCE(100),Employee_salary VARCHAR(100),Employee_department varchar(100),PRIMARY key(Employee_id));ALTER T
2022-06-29 00:30:12
94
原创 第二章:数据清洗及特征处理
2.1 缺失值观察与处理2.1.1 任务一:缺失值观察(1) 请查看每个特征缺失值个数(2) 请查看Age, Cabin, Embarked列的数据#加载所需的库import numpy as npimport pandas as pd#加载数据train.csvdf = pd.read_csv('train.csv')df.headdf.isna().sum()df[['Age','Cabin','Embarked']]2.2 重复值观察与处理2.1.2 任务二:对
2022-05-27 11:44:35
196
原创 动手学数据分析之数据载入和初步观察(1)
1.1 载入数据数据集下载Titanic - Machine Learning from Disaster | Kaggle1.1.1 任务一:导入numpy和pandas1.1.2 任务二:载入数据(1) 使用相对路径载入数据(2) 使用绝对路径载入数据二者的区别主要是文件所在的位置。相对路径直接显示在C盘对应的子文件夹里,而绝对路径显示到根目录。1.1.3 任务三:每1000行为一个数据模块,逐块读取1.1.4 任务四:将表头改成中文,...
2022-05-18 23:40:47
217
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人