python学习——pandas数据清洗

goto_past

于 2019-10-20 11:50:28 发布

阅读量508

点赞数

CC 4.0 BY-SA版权

分类专栏： python学习文章标签： python pandas 数据处理数据清洗

本文链接：https://blog.youkuaiyun.com/goto_past/article/details/102646696

本次学习主要针对pandas下的dataframe数据结构进行，采用数据为之前下载过的iris鸢尾花数据，首先利用pd.read_csv（）读取原表格数据。需要将原表格放在py文件的同目录下方便读取。

file_path = "D:\Anaconda3\envs\pytorch\projects\Pandas学习\iris.csv"
data_before = pd.read_csv(file_path,header=0,index_col=0,encoding="gbk")
data_after = data_before.iloc[0:10,0:10]#这里利用iloc切片截取了0-9行的数据
print('原始数据：\n{}'.format(data_after))
print('数据大小：{}\n'.format(data_after.shape))

啊啊去
接下来通过获取行、列标签（方便之后利用loc定位）+np.random随机函数获取随机darray数组用以产生nan空值。

index = data_after.index
col_in = data_after.columns
#print('{}\n{}'.format(index,col_in))

random_t = 10*np.random.random([4,4])
#print(random_t)
random_i = np.floor(random_t)#产生相应整数