需要离散化的数据示例:

实现代码
#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
datafile = '../data/discretization_data.xls' #参数初始化
data = pd.read_excel(datafile) #读取数据
data = data[u'肝气郁结证型系数'].copy()
k = 4
#等宽法
d1 = pd.cut(data, k, labels = range(k)) #等宽离散化,各个类比依次命名为0,1,2,3
#基于聚类分析的方法
from sklearn.cluster import KMean

本文介绍了Python中对连续数据进行离散化的两种方法:等宽法和聚类分析法。通过实例展示了等宽法的离散化结果图以及基于聚类分析的离散化结果,并补充了`cut`函数的使用方法,该函数能够方便地将数据划分为多个面元。
最低0.47元/天 解锁文章
800

被折叠的 条评论
为什么被折叠?



