python dataframe逻辑取值

我遇到的一个小需求,就是希望通过判断pandas dataframe中一列的值在两个条件范围(比如下面代码中所描述的逻辑,取小于u-3ε和大于u+3ε的值),然后取出dataframe中的所有符合条件的值,这个需求的解决与普通的iloc、loc、ix的方式不同,所以我想分享一下,希望可以帮到遇到这个困难的朋友们,下面是我的事例代码:

doc[~((doc.iloc[:,141:142]<(mean_value-3*std_value))&(doc.iloc[:,141:142]>(mean_value+3*std_value)))]

下面代码是去掉两端数据,保留中间数据

doc = doc[~((doc.iloc[:,141]>(mean_value+3*std_value))|(doc.iloc[:,141]<(mean_value-3*std_value)))]

data[(data.C>1)&(data.C<5)])

### 获取 Pandas DataFrame 中的值 #### 使用 `loc` 和 `iloc` 为了访问特定位置的数据,可以使用基于标签的 `.loc[]` 或者基于整数位置的 `.iloc[]`。 ```python import pandas as pd data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'], 'Age': [28, 34, 29, 42]} df = pd.DataFrame(data) print("通过 loc 访问第二行数据:") print(df.loc[1]) # 基于标签定位,这里指的是索引名为'1'的那一行[^1] print("\n通过 iloc 访问第三行数据:") print(df.iloc[2]) # 基于整数位置定位,即实际顺序中的第三个元素 ``` #### 单列或多列取值 如果只需要获取某一列或几列的内容,则可以直接指定列名作为参数传递给方括号操作符: ```python print("\n获取单列 Age 的所有记录:") age_series = df['Age'] print(age_series) print("\n获取多列 Name 和 Age 的所有记录:") name_age_df = df[['Name', 'Age']] print(name_age_df) ``` #### 条件筛选 对于更复杂的查询需求,比如根据某些条件来选取符合条件的行,可以通过布尔索引来实现。下面的例子展示了如何选出那些年龄超过三十岁的个体: ```python condition = df['Age'] > 30 filtered_df = df[condition] print("\n过滤后的结果 (Age>30):") print(filtered_df) ``` 当涉及到多个条件时,应该利用逻辑运算符 `&`(and), `|`(or),并确保每个条件都包裹在圆括号内以保持优先级正确无误[^2]。 例如,在水果列表中查找既属于想要购买(`fruitsInclude`)又不属于要排除掉(`vegetablesExclude`)的商品,或者是宠物种类为狗的情况下的处理方式如下所示: ```python fruits_include = ["Apple", "Banana"] veggies_exclude = ["Carrot"] mask = ((df['Category'].isin(fruits_include)) & (~df['Type'].isin(veggies_exclude))) | (df['Pet'] == 'Dog') resulting_rows = df[mask] print(resulting_rows) ``` 此段代码实现了对DataFrame对象按照设定好的复合条件下进行有效检索的功能[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wshzd

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值