【Python数据分析】Pandas按行遍历Dataframe

原创于 2019-07-19 13:33:46 发布 · 1.4w 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #dataframe

python 同时被 2 个专栏收录

36 篇文章

订阅专栏

图像处理&数据处理

18 篇文章

订阅专栏

本文介绍Pandas中itertuples()方法的应用，通过构建包含日期、数值及分类数据的数据集，演示如何利用itertuples()遍历DataFrame，并获取特定列的值。

Pandas按行遍历Dataframe的方法主要有两种：iterrows()和itertuples()，推荐使用itertuples()，其具体用法如下：

# 构建数据集
import pandas as pd
import numpy as np

N = 20

dataset = pd.DataFrame({
    'date': pd.date_range(start='2016-01-01',periods=N,freq='D'),
    'x1': np.linspace(0,stop=N-1,num=N),
    'x2': np.random.rand(N),
    'x3': np.random.choice(['Low','Medium','High'],N).tolist(),
    'x4': np.random.normal(100, 10, size=(N)).tolist()
    })

# 显示前五行
pd.set_option('display.max_columns', None)
print(dataset.head())

在这里插入图片描述

# 每一行返回一个Pandas对象
# 该Pandas对象的第一个元素是该行的索引值
# 剩余元素的值为剩余的行值
for item in dataset.itertuples():
    # 获取所有列标签
    print('获取所有列标签: ', item._fields)
    # 获取行索引
    print('\n获取行索引: ', item.Index)
    # 获取该行的x4值
    print('\n获取该行的x4值: ', item.x4)
    break

在这里插入图片描述