《利用python进行数据分析》学习 numpy库
一、基本概念
Numpy是高性能科学计算和数据分析的基础包,功能如下:
1、ndarray,一个具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组。
2、用于对整组数据进行快速运算的标准数学函数(无需编写循环)
3、用于读写磁盘数据的工具以及用于操作内存映射文件的工具
4、线性代数、随机数生成以及傅里叶变换功能
对于大部分数据分析应用而言,我最关注的主要功能主要集中在:
1、用于数据整理和清理,子集构造和过滤,转换等快速的矢量化数组运算。
2、常见的数组算法,如排序、唯一化、集合运算等。
3、高效的描述统计和数据聚合、摘要运算。
4、用于异构数据集的合并/连接运算的数据对齐和关系型数据运算
5、将条件逻辑表述为数组表达式(而不是带有if-elif-else的循环)。
6、数据的分组运算(聚合、转换、函数应用等)
NumPy的ndarray:一种多维数组对象
一、创建ndarray
1、使用array函数,这个函数接受一切序列化的对象
2、zeros和ones分别可以创建指定长度和形状的全0或全1数组,empty可以创建一个没有任何具体值的数组
3、arange函数 类似于内置的的range,但返回的是一个ndarray而不是列表
4、eye、identity 创建一个E
二、ndarray的数据类型
可以通过ndarray的astype方法显式的转换其dtype:
in:import numpy as np
in:arr = n