pandas 是一个用于数据操作和分析的开源 Python 库。它提供了高性能、易于使用的数据结构和数据分析工具。pandas 主要用于以下几种任务:
- 数据清洗:处理缺失数据、重复数据等。
- 数据转换:数据类型转换、数据重塑等。
- 数据分析:统计分析、数据聚合等。
- 数据可视化:与其他可视化库(如 Matplotlib、Seaborn)结合使用,生成图表。
pandas 的核心数据结构是 DataFrame 和 Series,它们分别用于处理二维和一维数据。
示例代码:
import pandas as pd
# 创建一个 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
# 打印 DataFrame
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago

被折叠的 条评论
为什么被折叠?



