本文用于学习pandas模块的基本使用方法!!!
from pandas import *
#import pandas as pd
import numpy as np
#读取csv、xlsx文件,获得DataFrame数据结构
#data = pd.read_csv('filename.csv',header=None)
#data = pd.read_excel('filename.xlsx')
#将DataFrame数据结构保存为csv文件
#data.to_csv('filename.csv',header=None,index=False)
'''
数据结构:Series
Series:由numpy数据类型和与之对应的索引组成
'''
#创建Series数据结构
obj = Series([3,2,1])
print(obj)
#获得Series数据结构对象的数据和索引
print(obj.values)
print(obj.index)
#获得唯一值组成的数组
print(obj.unique())
#获得各值出现的频率
print(obj.value_counts())
#判断缺失数据 True表示缺失
obj = Series([1,np.nan,2,np.nan,3,np.nan])
print(obj.isnull())
print(isnull(obj))
print(notnull(obj))
print(obj.notnull())
#删除缺失值
print(obj.dropna())
print(obj[obj.notnull()])
#对数据标记索引
obj = Series([1,2,3,4],index=['a','b','c','d'])
#通过索引的方式获取值
print(obj['a'])
#根据新索引重排,如果索引值不存在,引入Nan
print( obj.reindex(['e','d','c','b','a']) )
#设置缺失值为0
print( obj.reindex(['e','d','c','

这篇博客主要介绍了pandas模块的基础使用,包括数据读取、数据清洗和数据分析等核心功能。通过学习,读者可以掌握pandas在数据分析中的基本应用。
最低0.47元/天 解锁文章
4028

被折叠的 条评论
为什么被折叠?



