创建:os
os.makedirs(path),在当前目录下创建一个文件夹
{path一般使用os.path.join进行路径拼接,也可以直接用于索引}
打开数据集用with open,不能可视化数据,但是可以通过函数操作文件内部,比如.write
读取入python:pandas
1.read类型,多种,不同数据集不同读取(读取的文件可以print可视化)
2.iloc[]:对dataframe操作用iloc,按照行列序号索引;对张量,元组可以直接切片;
3..fillna():对dataframe中的NaN填充为括号内值
4.pd.get_dummies():对非数字列转换成独热编码,(如果没有dummy_na=True会自动舍弃独热后为1的NaN分类)
本文介绍了如何使用Python的os模块创建目录,特别是os.makedirs()函数。还讨论了数据集的读取,强调使用withopen以及pandas库。pandas的read方法用于不同数据格式的读取,而.iloc[]用于DataFrame的行列索引操作。此外,文章提到了数据清洗,如fillna()函数用于处理缺失值,以及pd.get_dummies()进行独热编码转换。
1676

被折叠的 条评论
为什么被折叠?



