数据分析入门知识pandas

本文介绍了Python数据分析库pandas的基础知识,包括Seres和DataFrame的使用,如索引、值、形状、类型等属性,以及数据清洗、统计方法如平均值、最大值、最小值等。此外,还讲解了数据合并的join和merge操作,以及时间序列处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析

  • python数据科学的基础
  • 机器学习课程的基础
  • 工具anaconda和jupyter
  • matplotlib
  • 查看系统字体:fc-list :lang=zh

numpy

pandas

  • Seres一维数组

    • t.index
    • t.values
  • DataFrame二维数组

    • 行索引,表明不同行,横向索引,叫index,0轴,axis=0
    • 行索引,表明不同列,纵向索引,叫columns,1轴,axis=1
    • t.index 行索引
      • 指定索引:t.index = ['x', 'y']
      • 重新设置索引:t.reindex(['x', 'y'])
      • 指定某一列作为index:t.set_index("name", drop=False)
      • 返回index的唯一值:t.set_index("name").index.unique()
      • 交换levels里面的索引:t.swaplevel()
    • t.columns 列索引
    • t.values 对象值,二维ndarray数组
    • t.shape 形状(行数,列数)
    • t.dtypes 类型
    • t.ndim 数据维度
    • t.head(3) 显示头部几行,默认5行
    • t.tail(3) 显示尾部几行,默认5行
    • t.info() 相关信息概览:行数、列数、列索引、列非空值个数、列类型、行类型、内存占用
    • t.describe() 快速综合统计结果:计算、均值、标准差、最大值、四分位数、最小值
    • t.loc() 通过标签索引行数据
    • t.iloc() 通过位置获取行数据
    • 判断数据是否为NaN:pd.isnull(t),pd.notnull(t)
      • 处理方式1:删除NaN所在的行列dropna(axis=0,how='any',inplace=False)
      • 处理方式2:填充数据t.fillna(t.mean())#均值,t.fiall(t.median()),t.fillna(0)
        处理为0的数据:t[t=0]=np.nan
        当然并不是每次为0的数据都需要处理
        计算平均值等情况,nan是不参与计算的,但是0会
        
  • pandas 常用统计方法

    • 平均值:df["xx"].mean()

    • 最大值:df["xx"].max()

    • 最大值索引:df["xx"].idxmax()

    • 最小值:df["xx"].max()

    • 最小值索引:df["xx"].idxmin()

    • 中位数:df["xx"].median()

    • join:默认是把行索引相同的数据合并到一起t1.join(t2)

    • merge:按照指定的列把数据按照一定的方式合并到一起t1.merge(t2, on="a", how="inner")

      • on:指定列
      • how->inner(默认)交集方式合并
      • how->outer 并集方式合并,NaN补全
      • how->left 以左边为准合并,NaN补全
      • how->right 以右边为准合并,NaN补全
  • 时间序列

    • ps.to_datetime(df["timeStamp"])

up-3566d0f51140977fd2048960fd706a127f8.png

相关练习代码仓库: https://gitee.com/yangpengfi/pythonStudy/tree/master/day15

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值