pandas-DataFrame行列访问

本文详细介绍了pandas DataFrame的行列访问方法,包括访问单列、多列、单行、多行,以及如何获取单元格的值。强调了使用loc和iloc的区别,以及如何通过布尔数组和标签索引进行精确操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


1.DataFrame概念

DataFrame可以理解为是由一个或多个不同数据类型的Series组成,DataFrame的一列其实就是一个Series。
DataFrame包括三部分:

  1. index行索引
  2. columns列索引
  3. values值
    在这里插入图片描述

2.DataFrame行列访问

在这里插入图片描述

2.1 访问一列,多列

在这里插入图片描述

2.2 访问一行,多行

在这里插入图片描述

2.3 访问某几行中的某几列

若要修改单元格中的值,推荐使用如下方式:
df.loc[行标签索引,列标签索引]
df.lo

### pandas DataFrame 使用教程及常见操作 #### 创建 DataFrame 可以利用多种方式创建 `DataFrame` 对象,包括但不限于一维数组、表、字典或 Series 字典等形式。对于更复杂的数据结构,如二维或具有特定结构的 NumPy 数组同样适用[^4]。 ```python import pandas as pd data = {'col_1': [3, 2, 1, 0], 'col_2': ['a', 'b', 'c', 'd']} df = pd.DataFrame.from_dict(data) print(df) ``` #### 基础属性与方法 获取有关 `DataFrame` 的基本信息,例如形状(shape)、名(columns)等是非常重要的。此外,还可以查看前几行(head())或后几行(tail())的数据以便快速浏览数据集[^1]。 ```python # 显示前五行数据 print(df.head()) # 获取数据框大小 print(f"Shape of dataframe is {df.shape}") # 查看所有名称 print(list(df.columns)) ``` #### 数据访问与选择 支持基于标签(label-based),位置(integer-based),布尔索引(boolean indexing)等多种形式的选择子集功能。这使得即使面对大型表格也能轻松定位所需部分。 ```python # 利用 loc[] 进行行列筛选 selected_data = df.loc[df['col_1'] > 1, :] print(selected_data) # iloc[] 实现整数位置选取 first_two_rows = df.iloc[:2] print(first_two_rows) ``` #### 添加新 可以通过简单的赋值语句向现有 `DataFrame` 中增加新的字段;也可以通过计算已有各之间的关系得到新特征并加入其中。 ```python # 新增一为 col_1 和 col_2 组合的结果 df['combined'] = df[['col_1', 'col_2']].apply(lambda row: str(row.col_1)+row.col_2, axis=1) print(df) ``` #### 缺失值处理 识别缺失值的位置,并采取适当措施填补(fillna())或是删除(dropna())含有空缺记录的行为,在数据分析前期准备阶段尤为关键[^3]。 ```python # 替换 NaNs with a specific value (e.g., mean or median) filled_df = df.fillna(value=df.mean()) print(filled_df.isnull().sum()) ``` #### 排序和重置索引 当需要按照某些条件重新排数据项时,sort_values() 方法提供了极大的灵活性。而 reset_index() 能够帮助恢复默认数值型索引。 ```python sorted_by_col1_descending = df.sort_values('col_1', ascending=False).reset_index(drop=True) print(sorted_by_col1_descending) ``` #### 分组聚合(GroupBy Aggregation) Groupby 是一种强大的工具用于执行按类别汇总统计的任务。它允许用户指定如何分割数据以及应用哪些函数来进行每组内部运算[^2]。 ```python grouped_stats = df.groupby(['col_2']).agg({'col_1': ['mean', 'min', 'max']}) print(grouped_stats) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值