(八)pandas数据结构

本文详细介绍了如何创建和操作pandas的Series和DataFrame数据结构。从创建Series和DataFrame,到Series的属性与别名方法、向量运算、布尔子集和自动对齐,再到DataFrame的更改、数据导入导出,全面阐述了pandas在数据分析中的基本操作。

除了掌握从文件加载数据外,我们还需要自己会创建数据。

创建数据

创建Series

dataFrame是由多个Series组成,也可以把Series称为DataFrame的列。列中数据类型都是一致的,如果在创建Series时,使用不同的数据类型,则会将所有成员转成类型object,这是一个更加通用的名字。

s=pd.Series(["bannana",42])

上面的的列表数据是两种类型,一种是字符串,是object类型,一个是int型数据,为一数据统一,将全部设置成object类型。
在创建Series时,可以使用index参数为各个数据指定一个行索引

s
### 关于 Pandas 数据结构的核心知识点 PandasPython 中用于数据分析的强大工具库,其核心数据结构主要包括 `Series` 和 `DataFrame`。以下是关于 Pandas 数据结构的相关内容及其应用: #### 1. Series 数据结构 `Series` 是 Pandas 中最基本的一维数组对象,类似于一维的 NumPy 数组,但它具有更丰富的功能和灵活性。它可以存储多种类型的数据,如整数、浮点数、字符串等[^1]。 创建一个 `Series` 对象的方法如下: ```python import pandas as pd data = [1, 3, 5, 7] s = pd.Series(data, index=['a', 'b', 'c', 'd']) print(s) ``` 上述代码展示了如何通过指定数据列表和自定义索引来构建一个 `Series` 对象。 --- #### 2. DataFrame 数据结构 `DataFrame` 是二维表格型数据结构,由多个 `Series` 构成,相当于 Excel 表格或 SQL 查询结果集。它是 Pandas 库中最常用的数据容器之一。 读取外部文件并将其转换为 `DataFrame` 的方式非常多样,例如从 Excel 文件加载数据: ```python import pandas as pd data = pd.read_excel("example.xlsx") print(data.head()) ``` 如果需要清理含有缺失值的数据,可以通过 `dropna()` 方法实现[^4]。 --- #### 3. HDF5 格式的高效数据存储 对于大规模数据处理任务,HDF5 提供了一种高效的二进制存储格式。Pandas 支持通过 `to_hdf()` 和 `read_hdf()` 函数来保存和读取 HDF5 文件[^2]。 下面是一个简单的例子展示如何使用 HDF5 存储和检索数据: ```python import pandas as pd # 创建示例 DataFrame df = pd.DataFrame({ 'A': range(10), 'B': ['foo', 'bar'] * 5, }) # 将数据写入 HDF5 文件 df.to_hdf('test.h5', key='df', mode='w') # 从 HDF5 文件中读取数据 loaded_df = pd.read_hdf('test.h5', 'df') print(loaded_df) ``` 此方法特别适合大数据量场景下的性能优化需求。 --- #### 4. 数据选择与索引技术 熟练掌握 Pandas 的索引操作是高效分析数据的关键技能。主要涉及的技术包括 `loc`, `iloc`, `at`, 和 `iat` 等[^3]。 以下是一些常见的索引操作实例: ```python import pandas as pd df = pd.DataFrame({ 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], }, index=[100, 101, 102]) # 使用 loc 进行标签索引 print(df.loc[100]) # 使用 iloc 进行列号索引 print(df.iloc[0]) ``` 更多高级用法可参考官方文档或其他权威书籍中的具体章节。 --- ### 总结 头歌平台上的 Pandas 数据结构教程通常会围绕以上几个方面展开讲解:基础概念(如 `Series` 和 `DataFrame`)、数据清洗(如缺失值处理)、高性能存储方案(如 HDF5),以及灵活的索引机制。建议结合实际案例深入学习这些主题,并尝试完成一些实验练习巩固所学知识。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

如之

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值