pandas基础-pandas之Series+ 读取外部数据+dataframe+dataframe的索引

本文详细介绍Pandas库中Series和DataFrame的创建、索引、切片、读取外部数据、数据处理等核心内容,包括数据清洗、布尔索引和字符串方法,适合数据分析师和开发者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

pandas之Series

pandas之series创建

 pandas之Series切片和索引

 pandas之series的索引和值​编辑

 pandas之读取外部数据

pandas之dataframe

pandas之dataframe的创建

 传入字典创建数据

dataframe的描述信息

dataframe的索引

pandas之loc

 pandas之iloc

 pandas之布尔索引

pandas之字符串方法

缺失数据的处理


常用数据类型:

1.series 一维,带标签数组

2.dataframe 二维,series 容器

pandas之Series

pandas之series创建

 

 pandas之Series切片和索引

 pandas之series的索引和值

 pandas之读取外部数据

import pandas as pd
### csv
pd.read_csv()
### mysql
pd.read_sql(sql_sentence,connection)
### mongodb
from pymongo import MongoClent
client = MongoClient()
collection = client["donban"]["tv1"]
data = list(collection.find())

t1 = data[0]
t1 = pd.Series(t1)

pandas之dataframe

pandas之dataframe的创建

 传入字典创建数据

dataframe的描述信息

 

 

dataframe的索引

import pandas as pd

df = pd.read_csv("./dogNames2.csv")

#dataframe中排序的方法
df = df.sort_values(by="Count_AnimalName",ascending=False)
# print(df.head(5))
# pandas取行或者取列的注意点
# - 方括号写数组,表示取行,对行进行操作
# - 写字符串,表示的去列索引,对列进行操作
print(df[:20])
print(df["Row_Labels"])

pandas之loc

 

 

 pandas之iloc

 

 

 pandas之布尔索引

import pandas as pd

# pandas读取csv中的文件
df = pd.read_csv("./dogNames2.csv")

# &且 |或
print(df[(800<df["Count_AnimalName"])&(df["Count_AnimalName"]<1000)])

pandas之字符串方法

# 转为列表
print(df["info"].str.split("/").tolist())

缺失数据的处理

 inplace = True 对之前的dataframe原地修改,就地修改

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值