1.读取文件
data_train = pd.read_csv("E:/KaggleT/train.csv")
2.查看数据
data_train.info()data_train.describe()
#查看特征内部的关系。看看男女各有多少人
data_train.Sex.value_counts() #男的比女的多
#丢掉没用的列data_train = data_train.drop(['Ticket'],axis=1)
本文介绍了如何使用Python中的Pandas库来读取并初步处理CSV格式的数据集,包括读取文件、查看基本信息、统计数据以及删除不必要的列。
1.读取文件
data_train = pd.read_csv("E:/KaggleT/train.csv")
2.查看数据
data_train.info()data_train.describe()
#查看特征内部的关系。看看男女各有多少人
data_train.Sex.value_counts() #男的比女的多
#丢掉没用的列data_train = data_train.drop(['Ticket'],axis=1)
817

被折叠的 条评论
为什么被折叠?