04.Pandas查询数据

本文介绍了一种天气数据预处理的方法,包括读取CSV文件、设置日期为索引、清洗温度数据等步骤,并概述了几种数据查询方式:单个label查询、列表批量查询、数值区间查询、条件表达式查询及函数查询。

在这里插入图片描述
数据预处理
tianqi数据如下

ymd,bWenDu,yWenDu,tianQi,fengXiang,fengJi,aqi,aqiInfo,aqLevel
2018-01-01,3°C,-5°C,🌤,东北风,1-2级,59,良,2
2018-02-22,6°C,-4°C,☀,西南风,2-3级,66,良,1
2018-02-03,4°C,-5°C,☼,西风,5-6级,39,优,1
2018-04-05,5°C,-2°C,☂,北风,1-2级,43,优,1
2019-02-01,2°C,-6°C,☁,南风,1-2级,27,良,2
2019-10-23,3°C,-1°C,🌤,东风,1-2级,18,良,2

import pandas as pd
df = pd.read_csv("../data/tianqi.csv")
# print(df.head())
# 设置以索引为日期,方便筛选
df.set_index('ymd', inplace=True)
# 替换掉温度的后缀
df.loc[:, "bWenDu"] = df["bWenDu"].str.replace("°C", "").astype('int32')
df.loc[:, "yWenDu"] = df["yWenDu"].str.replace("°C", "").astype('int32')

在这里插入图片描述

1.使用单个label值查询

行或者列,都可以只传入单个值,实现匹配
在这里插入图片描述

2.使用值列表批量查询

在这里插入图片描述

3.使用数值区间进行范围查询

在这里插入图片描述

4.使用条件表达式查询

在这里插入图片描述
在这里插入图片描述

5.调用函数查询

在这里插入图片描述

<think> 我们被要求判断关于Pandas的四个说法中哪一个是错误的。四个说法分别是: A. Pandas 基于 NumPy 构建 B. Pandas 可以处理缺失值 C. Pandas 不支持数据可视化 D. Pandas 支持读取和保存 Excel 文件 我们需要逐一分析每个选项: 1. **选项A: Pandas 基于 NumPy 构建** 根据引用[1]中提到“在使用Pandas库时,要确保安装并使用NumPy库”,并且引用[2]提到Pandas使用NumPy的NaN表示缺失值。实际上,Pandas是在NumPy的基础上构建的,它依赖NumPy提供高性能的数组操作。因此,这个说法是正确的。 2. **选项B: Pandas 可以处理缺失值** 引用[2]明确指出:“在Pandas中使用NaN(来自NumPy库)表示缺失值”,并且介绍了检测缺失值的方法。Pandas提供了一系列处理缺失值的函数,如`isnull()`、`fillna()`等。因此,这个说法也是正确的。 3. **选项C: Pandas 不支持数据可视化** 引用[3]提到:“本专栏将介绍四个在Python中广泛使用的数据可视化库,包括NumPy、Pandas、Matplotlib和Seaborn”。实际上,Pandas本身集成了Matplotlib,提供了简单的数据可视化功能,例如可以通过DataFrame或Series的`plot()`方法直接绘制图表。虽然Pandas的可视化功能不如Matplotlib或Seaborn强大,但它确实支持基本的数据可视化。因此,说“Pandas不支持数据可视化”是错误的。 4. **选项D: Pandas 支持读取和保存 Excel 文件** 这个说法是正确的。Pandas提供了`read_excel()`函数来读取Excel文件,以及`to_excel()`函数将数据保存为Excel文件。这需要安装额外的库(如openpyxl或xlrd),但Pandas确实支持这一功能。 因此,错误的选项是C。 但是,我们还需要验证一下引用内容。引用[3]确实将Pandas列为数据可视化库之一,说明Pandas是支持数据可视化的。因此,选项C的表述“Pandas不支持数据可视化”是错误的。 结论:错误选项是C。 注意:虽然Pandas的可视化功能是建立在Matplotlib之上的,但用户可以直接通过Pandas的接口进行绘图,所以不能说它不支持数据可视化。 因此,答案是C。 </think>### 关于Pandas说法的错误选项分析 #### 1. **A. Pandas 基于 NumPy 构建** **正确** Pandas 的核心数据结构(Series/DataFrame)底层依赖 NumPy 数组实现,其缺失值处理使用 NumPy 的 `NaN` 表示[^2]。引用[1]明确要求"确保安装并使用 NumPy 库",印证了这一依赖关系。 #### 2. **B. Pandas 可以处理缺失值** **正确** 引用[2]指出:Pandas 使用 NumPy 的 `NaN` 表示缺失值,并提供 `isnull()`, `fillna()`, `dropna()` 等方法处理缺失数据,这是其核心功能之一。 #### 3. **C. Pandas 不支持数据可视化** **错误** 引用[3]将 Pandas 列为数据可视化库之一,明确说明:"本专栏将介绍四个在 Python 中广泛使用的数据可视化库,包括 NumPy、Pandas、Matplotlib 和 Seaborn"。 **实际功能**: - 通过 `Series.plot()` 和 `DataFrame.plot()` 直接生成折线图、柱状图等 - 集成 Matplotlib 接口,支持自定义图表 - 提供 `plot.scatter()`, `plot.hist()` 等快速可视化方法 #### 4. **D. Pandas 支持读取和保存 Excel 文件** **正确** 通过 `pd.read_excel()` 和 `df.to_excel()` 实现 Excel 文件的读写,需依赖 `openpyxl` 或 `xlrd` 库。 --- ### 结论 **错误选项:C** Pandas 原生支持基础数据可视化(如通过 `plot()` 方法),且被官方文档和引用[3]明确列为数据可视化工具集成员。其可视化能力虽不如 Matplotlib/Seaborn 全面,但"不支持"的说法完全不成立。 --- ### 补充说明 Pandas 可视化示例: ```python import pandas as pd data = pd.Series([1, 3, 2, 4]) data.plot(kind='bar', title="示例图表") # 生成柱状图 ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值