创建:os
os.makedirs(path),在当前目录下创建一个文件夹
{path一般使用os.path.join进行路径拼接,也可以直接用于索引}
打开数据集用with open,不能可视化数据,但是可以通过函数操作文件内部,比如.write
读取入python:pandas
1.read类型,多种,不同数据集不同读取(读取的文件可以print可视化)
2.iloc[]:对dataframe操作用iloc,按照行列序号索引;对张量,元组可以直接切片;
3..fillna():对dataframe中的NaN填充为括号内值
4.pd.get_dummies():对非数字列转换成独热编码,(如果没有dummy_na=True会自动舍弃独热后为1的NaN分类)