python 查看数据维度_Python – 数据框的维数

这篇博客总结了在Python中如何查看DataFrame和Series的数据维度,包括使用`shape`属性获取行数和列数,利用`len`函数计算行数,通过`size`属性获取元素总数,以及用`ndim`属性确定维度。此外,还提到了`count`方法在计算非缺失值数量上的应用,以及`info`方法用于获取元数据和非缺失值统计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

所有获取DataFrame或Series的维度信息的方法摘要

有很多方法可以获取有关DataFrame或Series的属性的信息。

创build示例DataFrame和系列

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]}) df ab 0 5.0 9 1 2.0 2 2 NaN 4 s = df['a'] s 0 5.0 1 2.0 2 NaN Name: a, dtype: float64

shape属性

shape属性返回DataFrame中的行数和列数的两个项目的元组。 对于一个系列,它返回一个元素的元组。

df.shape (3, 2) s.shape (3,)

len函数

要获取DataFrame的行数或获取Series的长度,请使用len函数。 一个整数将被返回。

len(df) 3 len(s) 3

size属性

要获取DataFrame或Series中元素的总数,请使用size属性。 对于DataFrame,这是行数和列数的乘积。 对于一个系列,这将等于len函数:

df.size 6 s.size 3

ndim属性

ndim属性返回DataFrame或Series的维数。 对于DataFrames,系列总是2:

df.ndim 2 s.ndim 1

棘手的count方法

count方法可用于返回DataFrame的每个列/行的非缺失值的数量。 这可能是非常混乱的,因为大多数人通常认为count只是每行的长度,事实并非如此。 在DataFrame上调用时,将返回一个Series,索引中的列名称以及非缺失值的数量作为值。

df.count() # by default, get the count of each column a 2 b 3 dtype: int64 df.count(axis='columns') # change direction to get count of each row 0 2 1 2 2 1 dtype: int64

对于一个系列,只有一个计算轴,所以它只是返回一个标量:

s.count() 2

使用info方法检索元数据

info方法返回每个列的非缺失值和数据types的数量

df.info()

RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): a 2 non-null float64 b 3 non-null int64 dtypes: float64(1), int64(1) memory usage: 128.0 bytes

### NumPy 中的维度概念 在 Python 的科学计算领域,NumPy 是处理多组的核心库之一。NumPy 提供了一种称为 `ndarray` 的高效多组对象[^2]。 #### 维度定义 - **一组**:类似于线性表,只有一个轴方向的数据排列。 - **二组**:具有两个轴方向的数据排列,通常表示为矩阵形式。 - **三及以上组**:超过两个轴方向的数据排列,适用于更复杂的数据集结构。 #### 创建不同维度组 可以通过多种方式创建不同维度组: ```python import numpy as np # 一组 one_d_array = np.array([1, 2, 3]) print(f"One-dimensional array:\n{one_d_array}") # 二组 two_d_array = np.array([[1, 2], [3, 4]]) print(f"\nTwo-dimensional array:\n{two_d_array}") # 三组 three_d_array = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]]) print(f"\nThree-dimensional array:\n{three_d_array}") ``` #### 获取形状信息 使用 `.shape` 属性可以获取组各维度大小的信息: ```python shapes = [ one_d_array.shape, two_d_array.shape, three_d_array.shape ] for i, shape in enumerate(shapes, start=1): print(f"{i}D Array Shape: {shape}") ``` #### 转置操作 转置是一种常见的维度变换操作,主要用于交换组的不同轴: ```python original_2d = np.arange(0, 10).reshape(2, 5) transposed_2d = original_2d.T print(f"Original 2D Array:\n{original_2d}\n") print(f"Transposed 2D Array:\n{transposed_2d}") ``` #### Pandas 和维度关系 Pandas 构建于 NumPy 基础之上,提供了更高层次的数据结构——DataFrame 和 Series。虽然 Pandas 主要关注表格型数据分析,但在内部仍然依赖 NumPy 来管理底层数据存储和运算效率[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值