numpy、scipy、pandas都是python语言中的库,主要用于数据分析。
简要地说numpy主要用于处理矩阵,包括array、reshape、sort等功能,pandas是基于numpy的分析工具,包括Series、DataFrame功能,scipy是基于numpy的科学计算包。matplotlib用于数据的画图。
首先我们导入所有包

首先使用array创建二维数组

选取输出数组[0][0]值,选取方法跟c语言一样
选取输出[0]行值 
使用pd.Series方法创建一维数组,需要注意的是排列方式为竖排列
更改数组索引
根据索引寻找数据
使用DataFrame创建表格型数据结构

选取表格中姓名进行输出

python选取规则为左闭右开(左选右不选)

给数据加上新的标签并赋值

选取表格中name 字段和sex字段进行输出

找寻标签sex=='女'的进行输出

与上面形成对比,直接使用df.sex输出为bool型进行判断

对于数据进行一定的选取规则限制

下面是一个最简单的数据可视化例子

本文介绍了Python中用于数据分析的核心库numpy、pandas和scipy的基础用法。numpy主要处理矩阵运算,如array创建、行列选取;pandas提供了DataFrame和Series数据结构,方便数据操作;scipy是科学计算包,辅助进行复杂计算。matplotlib则用于数据可视化,展示图表。通过实例展示了如何创建、操作和选择数据,以及简单的数据可视化过程。
1906

被折叠的 条评论
为什么被折叠?



