pandas数据离散化

pandas数据离散化

数据离散化,是将连续的数据,通过分割,形成离散化的数据。举个例子,比如有一列数据存储人的身高:165,174,160,180,159,163,192,184,那么通过离散化可以变为:150~165, 165~180,180~195。还有另外一种离散化的数据,就是通过one-hot编码,下面会详细讲到。

切割数据离散化:

pandas中使用pd.qcut或者是pd.cut方法实现数据切割。
pd.qcut(data, q)的函数意义为:

  • data:需要被切割的数据。
  • q:需要切割多少个组。

示例代码如下:

df = pd.read_csv("data/stock_day.csv")
qcut = pd.qcut(df['p_change'], 6)
qcut.value_counts()

输出结果如下:

(-10.030999999999999, -4.836]    65
(-0.462, 0.26]                   65
(0.26, 0.94]                     65
(5.27, 10.03]                    65
(-4.836, -2.444]                 6
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值