机器学习中经常要处理各种data format的数据,希望使用一个统一的数据处理package, 看中了pandas。在学习的过程中不定期更新。
pandas中使用read_csv, read_json 之类的函数,读出来的格式是dataframe。dataframe是一个在行列两个维度上都有index的表格式的数据结构,可以用dataframe.values函数来把它转换成numpy array进行处理。
机器学习中经常要处理各种data format的数据,希望使用一个统一的数据处理package, 看中了pandas。在学习的过程中不定期更新。
pandas中使用read_csv, read_json 之类的函数,读出来的格式是dataframe。dataframe是一个在行列两个维度上都有index的表格式的数据结构,可以用dataframe.values函数来把它转换成numpy array进行处理。