df[条件][新增列名]与df.loc[条件][新增列名]区别(了解底层原因)

最新推荐文章于 2025-07-14 21:16:07 发布

ikeepo

最新推荐文章于 2025-07-14 21:16:07 发布

阅读量5.3k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Error Record # 小白学Python 文章标签： loc[][] df[][] Multiindex

本文链接：https://blog.youkuaiyun.com/The_Time_Runner/article/details/84554463

小白学Python 同时被 2 个专栏收录

489 篇文章

订阅专栏

Error Record

144 篇文章

订阅专栏

本文详细解析了Pandas库中如何通过条件筛选数据，以及如何对数据框的列进行操作，包括添加新列、修改列值等，并区分了DataFrame与Series的数据类型。

在数据处理过程中,经常要对符合某种条件的行列进行操作,有时候会犯迷糊,这里详细解释一下pandas是怎么识别df[]的.

df[<条件>]   # 得到的是一个新的df1,对其进行任何操作,对原来的df不产生影响.
type(df[<条件>])   # 数据类型是DataFrame
>> <class 'pandas.core.frame.DataFrame'>


df['列名']   # 得到的是df中'列名'这一列,
type(df['列名'])   # 数据类型是series
>> <class 'pandas.core.series.Series'>

df['新列名'] = 0   # 原df发生改变,在df中添加新列,且新列取值为0

df[<条件>]['新增列名']=0   
# 这么写的本意是获取满足条件的新的df1,然后对新的df1增加新的一列,并将新的一列赋值为0,但此时会报错
# df[][] 这种结构,python会自动识别为获取Multiindex,具体见下图


=======================================================
=======================================================
df.loc[<条件>][<新增列名>]   
# 本质是一个函数.loc[row_index,col_index]有自己特定的语法规范
# df.loc[<条件>][<新增列名>]是想当然的,是不合语法的