数据分析:pandas

把数据中的第一列设置为index:

import numpy as np
import pandas as pd
import os
import csv
path=os.getcwd()+'\\data.csv'
f=open(path)
users=pd.read_csv(f,index_col='item')
print(users.head(10))

it
列包括数据的数量:

users['high'].nunique()

数据描述性统计:

users.describe()
users.high.describe()#仅选一列进行描述性统计

某一类的最大值

chipo.sort_values(by='high',ascending=False).head(1)

某一类的最小值

chipo.sort_values(by='high',ascending=True).head(1)

某一类别的次数以及一类别大于多少

chipo_drink_steak_bowl = chipo[(chipo.item_name == "Canned Soda") & (chipo.quantity > 1)]

选择数据的行和列:iloc

euro12.iloc[:,0:6]

选择数据的行和列:loc

army.loc[['Maine','Alaska'] , ["deaths","size","deserters"]]

选择列数据:

army['Goals']
army[['Goals','Shots on target']]#多个列时,需要加两个中括号

按条件选择数据

army[army['Goals']>3]
army[(army['Goals']>3)&(army['Goals']<5)]
army[(army['Goals']>3)|(army['Goals']<5)]

聚类:groupby:

drinks.groupby('continent').beer_servings.mean()
drinks.groupby('continent').wine_servings.describe()
drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])#agg则包含了多个参数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jiuxianfei

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值