数据分析8

目录

DataFrame 

基础

字典

列表

排序

索引

 loc与iloc

nan值 

判断nan 

删除nan 

替换nan


DataFrame 

基础

import pandas as pd
import numpy as np
t1=pd.DataFrame(np.arange(12).reshape(3,4),index=["a","b","c"],columns=list('wxyz'))
print(t1)

字典

d1={"name":["马化腾","马云"],"age":[50,52],"tel":[10086,10085]}
t2=pd.DataFrame(d1)
print(t2)

 

列表

d2=[{"name":"马化腾","age":50,"tel":10086},{"name":"马云","age":52,"tel":10085}]
t3=pd.DataFrame(d2)
print(t3)

 

排序

df=df.sort_values(by='人气值',ascending=False)

by表示需要排序的内容,ascending为true默认升序排序

df=pd.read_csv("D:\\python\\5.数据分析\\test")
df=df.sort_values(by='人气值',ascending=False)
df=pd.DataFrame(df)
print(df)

 

索引

print(df[:2]) #取行
print(df["年龄"])#取列
print(df[(25<df["年龄"])&(df["年龄"]<35)])
print(df[df["姓名"].str.len()>2])

 

 

 

print(t1.loc["a","Z"])#取一个值

 

 loc与iloc

loc[]:通过标签索引行数据,iloc[]:通过位置索引行数据
t1=pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=["W","X","Y","Z"])

 

print(t1.loc["a","Z"])#取一个值,结果为3
print(t1.loc["a"]) #取一行
print(t1.loc[:"b"]) #取多行
print(t1.loc["a":"c",["W","Z"]]) #从a列到c列
print(t1.iloc[:,[2,1]])
print(t1.iloc[1:,:2])

 

nan值 

判断nan 

#判断nan
t1.iloc[[1,2],[2,3]]=np.nan
print(pd.isnull(t1))

删除nan 

#删除nan
print(t1.dropna(axis=0,how="any",inplace=False)) #any表示该行有nan就删除这一行,
print(t1.dropna(axis=0,how="all",inplace=False)) #inplace是True就直接替换t1

 替换nan

#替换nan
t1["Y"]=t1["Y"].fillna(t1["Y"].mean())
print(t1)
t1=t1.fillna(t1.mean())
print(t1)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值