1. Python中的数组
形式
用list和tuple等数据结构表示数组
- 一维数组 list=[1,2,3,4]
- 二维数组 list = [[1,2,3],[4,5,6],[7,8,9]]
array模块
- 通过安装array模块,利用array函数创建数组。array.array(“B”,range(5))
- 提供append,insert和read等方法
2.ndarray
ndarray是N维数组
- Numpy中基本的数据结构
- 所有元素是同一种类型
- 别名为array
- 利用节省内存和提高CPU计算时间
ndarray数组属性
- 维度(dimensions)称为轴(axis),轴的个数称为(rank)
- 基本属性
- ndarray.ndim(秩)
- ndarray.shape(维度)
- ndarray.size(元素总个数)
- ndarray.dtype(元素类型)
- ndarray.itemsize(元素字节大小)
ndarray的创建方法:
| arange | array |
|---|---|
| copy | empty |
| empty_like | eye |
| fromfile | fromfunction |
| identity | linspace |
| logspace | mgrid |
| ogrid | ones |
| ones_like | r |
| zeros | zeros_like |
>>>import numpy as np
>>>aArray = np.array([1,2,3])
>>>aArray
array([1,2,3])
>>>bArray = np.array([(1,2,3),(4,5,6)])
>>>bArray
array([[1,2,3],
[4,5,6]])
>>>np.arange(1,5,0.5)
array([1.,1.5,2.,2.5,3.,3.5,4.,4.5])
>>>np.random.random((2,2))
array([[0.7977704,0.1468679],[0.95838379,0.86106278]])
>>>np.linspace(1,2,10,endpoint=False)
array([1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9])
ndarray的运算方法:
| sum | mean |
|---|---|
| std | var |
| min | max |
| argmin | argmax |
| cumsum | cumprod |
ndarray的ufunc函数:
ufunc(universal function)是一种能对数组的每个元素进行操作的函数。NumPy内置的许多ufunc函数都是在C语言级别实现的,计算速度非常快
| add | all |
|---|---|
| any | arange |
| apply_along_axis | argmax |
| argmin | argsort |
| average | bincount |
| ceil | clip |
| conj | corrcoef |
| cov | cross |
| cumprod | cumsum |
| diff | dot |
| exp | floor |
Series
- 基本特征
- 类似一维数组的对象
- 由数据和索引组成
from pandas import Series
>>> aSer = pd.Series([1,2.0,'a'])
>>>aSer
0 1
1 2
2 a
dtype:int64
- Series的name属性
- 重要功能
- Series对象本身及其索引均有一个name属性
- Series的name属性与其他重要功能关系密切
- 重要功能
Dataframe
- 基本特征
- 一个表格型的数据结构
- 含有一组有序的列(类似于index)
- 大致可看成共享一个index的Series集合
本文介绍了Python中的数组,包括一维和二维数组的表示,以及使用array模块创建数组的方法。重点讲解了Numpy中的ndarray数据结构,它的基本属性如维度、形状、元素类型等,并探讨了ndarray的创建和运算方法,特别是ufunc函数的作用。此外,还提到了Pandas中的Series和DataFrame数据结构,强调了它们的基本特征和重要功能。
4265

被折叠的 条评论
为什么被折叠?



