文章目录
pandas数据分析常用函数
前言
网上教程多分散,需要会员,现将学习机器学习过程中用到的函数进行整理,方便后续自查。同时,会持续更新。
DataFrame 和 Series理解
两者都是pandas中的数据结构,前者是二维的,后者是一维的,可以理解为Series就是DataFrame的一列而已,只含索引和一列
循环遍历DataFrame
import pandas as pd
# ['姓名', '证件号码', '手机号']
df1 = pd.DataFrame(pd.read_excel('人员信息.xlsx'))
print(df1.head())
for index, row in df1.head().iterrows():
print(row['手机号'])
index ,必不可少
循环遍历Series
from pandas import Series
index = ['01','02','03','04','05','06','07','08']
data = ['张三','李四','王五','谢六','崔七','刘八','文九','余十']
series = Series(data=data,index=index)
print(series)
01 张三
02 李四
03 王五
04 谢六
05 崔七
06 刘八
07 文九
08 余十
dtype: object
# 遍历series 两种方式都可
# for value in series.values:
for value in series:
print(value)
输出如下:
张三
李四
王五
谢六
崔七
刘八
文九
余十
# 遍历series 拿到index
for key in series.keys():
print(key)
输出如下:
01
02
03
04
05
06
07
08
# 遍历series 拿到索引和数据,元组格式,可是按照数组去遍历
for key_value in series.items():
print(key_value)
输出如下:
('01', '张三')
('02', '李四')
('03', '王五')
('04', '谢六')
('05', '崔七')
('06', '刘八')
('07', '文九')
('08', '余十')