【科学计算与可视化】2. pandas 基础

1. 安装 Pandas

首先,确保你已经安装了 Pandas。你可以使用以下命令安装:pip install pandas

2. 导入 Pandas

在开始使用 Pandas 之前,你需要先导入它:import pandas as pd

3. 创建数据结构

Pandas 主要有两种数据结构:SeriesDataFrame

3.1 Series

Series 是一个一维的标签数组,类似于 Python 的列表或字典。

import pandas as pd
s = pd.Series([1,2,3, np.nan, 6, 8, None], dtype=np.float32)
print(s)
s2 = pd.Series([100, 200, 300, 400], ["A", "B", "C", "D"])  # pd.Series(data, index)  data 与 index 必须都是一维的
print(s2)
s2.to_csv("s2.csv")  # 将数据保存为 csv

s3 = pd.Series(np.arange(12))   # 从 ndarray 创建
s4 = pd.Series({
   "a": 1, "b": 2, "c": 3})  # 从字典创建
s5 = pd.Series(5, ["a", "b", "c"])  # 从标量值 创建
print(s5['a'])  # Series 中数组的访问 类似于 python 中字典的访问

3.2 DataFrame

DataFrame 是一个二维的标签数据结构,类似于电子表格或 SQL 表格。

# 创建一个 DataFrame
data = {
   
    "A": [1, 2, 3, 4, 5],
    "B": [6, 7, 8, 9, 10],
    "C": [11, 12, 13, 14, 15]
}
df = pd.DataFrame(data)
print(df)

# 使用多个 series 来构建  series 中可以缺少数据
df2 = pd.DataFrame({
   
    'name': pd.Series(["Tom", "Nick", "John", "Tom", "John"], index = ["A", "B", "C", "D", "E"]),
    'age': pd.Series([20, 21, 19, 22,], index = ["A", "B", "C", "D"]),
    'gender': pd.Series(["M", "M", "M", "F", "F"], index = ["A", "B", &#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值