Python-数组

最新推荐文章于 2022-12-07 22:21:54 发布

原创最新推荐文章于 2022-12-07 22:21:54 发布 · 651 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据结构

python 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了Python中的数组，包括一维和二维数组的表示，以及使用array模块创建数组的方法。重点讲解了Numpy中的ndarray数据结构，它的基本属性如维度、形状、元素类型等，并探讨了ndarray的创建和运算方法，特别是ufunc函数的作用。此外，还提到了Pandas中的Series和DataFrame数据结构，强调了它们的基本特征和重要功能。

1. Python中的数组

形式

用list和tuple等数据结构表示数组
- 一维数组 list=[1,2,3,4]
- 二维数组 list = [[1,2,3],[4,5,6],[7,8,9]]
array模块
- 通过安装array模块，利用array函数创建数组。array.array(“B”,range(5))
- 提供append,insert和read等方法

2.ndarray

ndarray是N维数组

Numpy中基本的数据结构
所有元素是同一种类型
别名为array
利用节省内存和提高CPU计算时间

ndarray数组属性

维度(dimensions)称为轴(axis),轴的个数称为(rank)
基本属性
　- ndarray.ndim(秩)
　- ndarray.shape(维度)
　- ndarray.size(元素总个数)
　- ndarray.dtype(元素类型)
　- ndarray.itemsize(元素字节大小)

ndarray的创建方法：

arange	array
copy	empty
empty_like	eye
fromfile	fromfunction
identity	linspace
logspace	mgrid
ogrid	ones
ones_like	r
zeros	zeros_like

>>>import numpy as np
>>>aArray = np.array([1,2,3])
>>>aArray
array([1,2,3])
>>>bArray = np.array([(1,2,3),(4,5,6)])
>>>bArray
array([[1,2,3],
      [4,5,6]])
>>>np.arange(1,5,0.5)
array([1.,1.5,2.,2.5,3.,3.5,4.,4.5])
>>>np.random.random((2,2))
array([[0.7977704,0.1468679],[0.95838379,0.86106278]])
>>>np.linspace(1,2,10,endpoint=False)
array([1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9])

ndarray的运算方法：

sum	mean
std	var
min	max
argmin	argmax
cumsum	cumprod

ndarray的ufunc函数：
ufunc(universal function)是一种能对数组的每个元素进行操作的函数。NumPy内置的许多ufunc函数都是在C语言级别实现的，计算速度非常快

add	all
any	arange
apply_along_axis	argmax
argmin	argsort
average	bincount
ceil	clip
conj	corrcoef
cov	cross
cumprod	cumsum
diff	dot
exp	floor

Series
- 基本特征
　- 类似一维数组的对象
　- 由数据和索引组成

from pandas import Series
>>> aSer = pd.Series([1,2.0,'a'])
>>>aSer
0  1
1  2
2  a
dtype:int64

Series的name属性
- 重要功能
  　　- Series对象本身及其索引均有一个name属性
  　　- Series的name属性与其他重要功能关系密切

Dataframe

基本特征
　- 一个表格型的数据结构
　- 含有一组有序的列(类似于index)
　- 大致可看成共享一个index的Series集合