Pandas玩转数据(十) -- 数据分箱技术Binning

本文主要介绍如何使用Pandas库在Python中进行数据分箱(Binning)操作,详细解析数据分箱技术在数据分析过程中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析汇总学习

https://blog.youkuaiyun.com/weixin_39778570/article/details/81157884

import pandas as pd
import numpy as np
from pandas import Series, DataFrame


# 随机生成一段成绩
score_list = np.random.randint(25, 100, size=20)
score_list
Out[5]: 
array([53, 67, 36, 37, 30, 63, 83, 83, 54, 97, 32, 74, 52, 47, 82, 71, 59,
       59, 97, 25])

# 进行cut分箱, bins为剪切范围
bins = [0,59,70,80,100]
pd.cut(score_list, bins)
Out[7]: 
[(0, 59], (59, 70], (0, 59], (0, 59], (0, 59], ..., (70, 80], (0, 59], (0, 59], (80, 100], (0, 5
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值