2017.02.16:利用Python进行数据分析01

本文介绍Numpy库的特性,包括快速多维数组处理、标准数学函数应用及线性代数等功能,并探讨了IPython提供的交互式Python Shell及其模块深度重载功能。此外,还介绍了使用Numpy进行数据清理、描述统计等高级数据分析技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.IPython:一种交互式的pythonshell。IPython提供了一个特殊的dreload函数,解决模块的“深度”(递归)重加载。

2.Numpy:NumericalPython

2.1.ndarray:具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组。

2.2.用于对整组数据进行快速运算的标准数学函数(无需编写循环)。

2.3.用于读写的磁盘数据的工具以及用于操作内存映射文件的工具。

2.4.线性代数、随机数生成及傅里叶变换功能。

3.对于数据分析:

3.1.数据清理:集合构造和过滤,转换等快速的矢量化数组运算。

3.2.常用的数组算法运算,唯一化、集合运算

3.3.高效的描述统计和数据聚合/摘要运算。

3.4.用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。

3.5.将田间逻辑表述为数组表达式,代替if-elif-else。

3.6.数据的分组运算。

4.ndarray:通用的同构数据多维容器,每个数组都只有一个shape,dtype。

4.1.dtype是一个特殊对象,它含有ndarray,将一块内存解释为待定数据类型所需的信息。

5.花式索引和切片不一样,将数据复制到新数组中。

6.Numpy数组使得将多种数据处理任务表述为简洁地数组表达式。一般来说,矢量量化数组运算要比等价的纯python方式快上一两个数量级。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值