AAA pandas十大清洗技巧

在Pandas中,查询数据是常见的操作,以下是几种常用的方法:

### 1. **布尔索引**
通过条件表达式生成布尔序列,筛选出符合条件的行。

```python
import pandas as pd

# 示例数据
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8]
})

# 查询A列大于2的行
result = df[df['A'] > 2]
print(result)
```

### 2. **`loc` 方法**
通过标签或布尔索引查询数据。

```python
# 查询A列大于2的行
result = df.loc[df['A'] > 2]
print(result)

# 查询特定行和列
result = df.loc[df['A'] > 2, 'B']
print(result)
```

### 3. **`iloc` 方法**
通过位置索引查询数据。

```python
# 查询第2行到第3行,第1列到第2列的数据
result = df.iloc[1:3, 0:2]
print(result)
```

### 4. **`query` 方法**
使用字符串表达式查询数据。

```python
# 查询A列大于2的行
result = df.query('A > 2')
print(result)
```

### 5. **`isin` 方法**
查询某列值在指定列表中的行。

```python
# 查询A列值在[2, 4]中的行
result = df[df['A'].isin([2, 4])]
print(result)
```

### 6. **`between` 方法**
查询某列值在指定范围内的行。

```python
# 查询A列值在1到3之间的行
result = df[df['A'].between(1, 3)]
print(result)
```

### 7. **`apply` 方法**
通过自定义函数查询数据。

```python
# 查询A列值为偶数的行
result = df[df['A'].apply(lambda x: x % 2 == 0)]
print(result)
```

### 8. **`where` 方法**
返回与原DataFrame形状相同的对象,不满足条件的值为NaN。

```python
# 查询A列大于2的行,不满足条件的值为NaN
result = df.where(df['A'] > 2)
print(result)
```

### 9. **`mask` 方法**
与`where`相反,满足条件的值为NaN。

```python
# 查询A列大于2的行,满足条件的值为NaN
result = df.mask(df['A'] > 2)
print(result)
```

### 10. **`at` 和 `iat` 方法**
`at`用于通过标签查询单个值,`iat`用于通过位置查询单个值。

```python
# 查询第1行,A列的值
value_at = df.at[0, 'A']
print(value_at)

# 查询第1行,第1列的值
value_iat = df.iat[0, 0]
print(value_iat)
```

 

 

 

 

 

 

 

这些方法涵盖了Pandas中常见的数据查询操作,根据具体需求选择合适的方法即可。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值