pandas 第一节(初始化和切片)

本文深入讲解了Pandas库中Series对象的基本操作,包括初始化、类型转换、索引访问、切片、条件筛选等核心功能,并演示了如何使用索引名称和位置进行数据检索。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding:utf-8 -*-
import pandas as pd
import string

'''
Series 对象是由两个数组组成,一个是索引(Index) 一个是值(values) 构造成键值对

'''
# Series数据初始化 列表
s1 = pd.Series([1, 2, 3], index=["a", "b", "c"])
print(type(s1))  # <class 'pandas.core.series.Series'>
print(s1)

# Series数据初始化 字典,key作为索引
a = {string.ascii_uppercase[i]: i for i in range(5)}
s1 = pd.Series(a)
print(s1)
s2 = s1.astype("float")  # 更改类型
print(s2)
# 重新指定索引的话,根据所以取到其值,取不到就NaN
s2 = pd.Series(a, index=list(string.ascii_uppercase[3:6]))
print(s2)

# 根据索引来获取值
# print(s2["d"]) #索引找不到 报错
print(s2["D"])  # 3.0
print(s2["F"])  # nan
# 根据索引位置来获取值
print(s2[0])  # 3.0
print(s2[2])  # nan
# 切片
print(s2[:3])  # 取连续的前三条数据
print(s2[[0, 2]])  # 取不连续的两条数据
print(s2[s2 > 3])  # 取大于3的值
print(s1[["A", "C", "D"]])  # 通过索引名称来获取不连续的值
print(s1[0:4:2])  # 增加步长参数
# 获取索引名称
print(s1.index)  # Index(['A', 'B', 'C', 'D', 'E'], dtype='object')
print(list(s1.index))  # ['A', 'B', 'C', 'D', 'E']
# 获取值
print(s1.values)  # [0 1 2 3 4] <class 'numpy.ndarray'>
# 注意:Series中的where和numpy中的where有差异
print(s1.where(s1 > 2))  # 小等于2的标记为NaN
print(s1.where(s1 > 2, 10))  # 小等于2的标记为10



 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值