pandas数据分析常用函数(持续更新)

pandas数据分析常用函数

前言

网上教程多分散,需要会员,现将学习机器学习过程中用到的函数进行整理,方便后续自查。同时,会持续更新。

DataFrame 和 Series理解

两者都是pandas中的数据结构,前者是二维的,后者是一维的,可以理解为Series就是DataFrame的一列而已,只含索引和一列

循环遍历DataFrame

import pandas as pd
# ['姓名', '证件号码', '手机号']
df1 = pd.DataFrame(pd.read_excel('人员信息.xlsx'))
print(df1.head())
for index, row in df1.head().iterrows():
    print(row['手机号'])

index ,必不可少

循环遍历Series

from pandas import Series
index = ['01','02','03','04','05','06','07','08']
data = ['张三','李四','王五','谢六','崔七','刘八','文九','余十']
series = Series(data=data,index=index)
print(series)
01    张三
02    李四
03    王五
04    谢六
05    崔七
06    刘八
07    文九
08    余十
dtype: object
# 遍历series  两种方式都可
# for value in series.values: 
for value in series:
    print(value)

输出如下:

张三
李四
王五
谢六
崔七
刘八
文九
余十
# 遍历series 拿到index
for key in series.keys():
    print(key)

输出如下:

01
02
03
04
05
06
07
08
# 遍历series 拿到索引和数据,元组格式,可是按照数组去遍历
for key_value in series.items():
    print(key_value)

输出如下:

('01', '张三')
('02', '李四')
('03', '王五')
('04', '谢六')
('05', '崔七')
('06', '刘八')
('07', '文九')
('08', '余十')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值