Pandas常用方法二

本文详细介绍了Python在数据分析领域的常用方法,包括数学统计、排序、分箱、分组聚合以及时间序列分析。通过实例展示了如何使用pandas库进行数据处理,如等距和等频数分箱,分组统计,时间戳操作以及重采样。此外,还探讨了基本的数据可视化,如线形图、散点图、条形图等多种图表的绘制,帮助读者掌握数据洞察和展示的技能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、数学和统计方法

统计方法

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(1,20,size=(6,2)), 
                  index=list('qwerty'),
                  columns=['C++', 'Math'])
df
df['C++'].argmax()  # 返回最大值索引顺序

df['C++'].idxmax() # 返回最大值值的索引value
df.cummax()  # 累计最大值
df.cummin() # 累计最小值
df.cumprod() # 累乘
df.cumsum()  # 累加

df.diff() # 差分,当前数据减去上一个的差值
df.pct_change().round(1) # 环比增加百分比  2012/2011 - 1 
df.cov()   # 协方差
df.std()   # 标准差
df.corr()  # 求相关系数

df.corrwith(df['Math'])

排序

df.sort_index(axis=0)  

df.sort_values(by='C++', ascending=False)
df.sort_values(by = ['C++','Math'],ascending=True) 
# 先根据'C++'进行排序,如果相等在根据'Math'排序
df.nlargest(3, columns='Math')  # 根据Math找到前n大的数
df.nsmallest

2、分箱

什么是分箱?
就是把连续数据切分成离散区间,例如考试分数,按及格、优秀统计;按每十分区间统计

df = pd.DataFrame(np.random.randint(0,100,(50,2)),
                 columns=['语文', '数学'])
df.head()

等距分箱

pd.cut(df['数学'][:5],
       bins=10, # 等宽度分成10份
       labels=['0-10','10-20','20-30','30-40','40-50',
              '50-60','60-70','70-80','80-90','90-100',],
       right = True)  # 区间,闭区间)

# 索引0的同学 是50-60区间
df['status'] = pd.cut(
                    df['语文'],
                    bins=[0,60,80,90,100], # 自己设置区间
                    labels=['不及格','及格','优秀', '天才']
                    )

等频数分箱,每个箱子拥有相同的记录数

df['qcut'] = pd.qcut(
                    df['数学'],
                    q=5,
                    labels=None
                )

df.qcut.value_counts()
# 把0-100分平均分成5份,差不多20分为一个箱子

3、分组聚合

分组

就是根据分类变量来分组统计

df = pd.DataFrame(data = {
   'Sex':np.random.randint(0,2,size = 30),
                          'Class':np.random.randint(1,3
### IntelliJ IDEA 中通义 AI 功能介绍 IntelliJ IDEA 提供了一系列强大的工具来增强开发体验,其中包括与通义 AI 相关的功能。这些功能可以帮助开发者更高效地编写代并提高生产力。 #### 安装通义插件 为了使用通义的相关特性,在 IntelliJ IDEA 中需要先安装对应的插件: 1. 打开 **Settings/Preferences** 对话框 (Ctrl+Alt+S 或 Cmd+, on macOS)。 2. 导航到 `Plugins` 页面[^1]。 3. 在 Marketplace 中搜索 "通义" 并点击安装按钮。 4. 完成安装后重启 IDE 使更改生效。 #### 配置通义服务 成功安装插件之后,还需要配置通义的服务连接信息以便正常使用其提供的各项能力: - 进入设置中的 `Tools | Qwen Coding Assistant` 菜单项[^2]。 - 填写 API Key 和其他必要的认证参数。 - 测试连接以确认配置无误。 #### 使用通义辅助编程 一旦完成上述准备工作,就可以利用通义来进行智能编支持了。具体操作如下所示: ##### 自动补全代片段 当输入部分语句时,IDE 将自动提示可能的后续逻辑,并允许一键插入完整的实现方案[^3]。 ```java // 输入 while 循环条件前半部分... while (!list.isEmpty()) { // 激活建议列表选择合适的循环体内容 } ``` ##### 解释现有代含义 选中某段复杂的表达式或函数调用,右键菜单里会有选项可以请求通义解析这段代的作用以及优化意见。 ##### 生产测试案例 对于已有的业务逻辑模块,借助于通义能够快速生成单元测试框架及初始断言集,减少手动构建的成本。 ```python def test_addition(): result = add(2, 3) assert result == 5, f"Expected 5 but got {result}" ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值