自然间断点是进行数据分类最常用的方法之一。
使用Jenkspy库计算自然间断点
1、pypi安装jenkspy
pip install jenkspy
2、调用jenkspy
import jenkspy
import random
list_of_values = [random.random()*5000 for _ in range(12000)]
breaks = jenkspy.jenks_breaks(list_of_values, nb_class=6)
print breaks
在数据量较大的情况下,速度很---慢
7.5w条数据统计5个间断点耗时30s左右

本文介绍了一种数据分类方法——自然间断点算法,并演示了如何使用jenkspy库计算自然间断点,适用于大数据集的数据分类。通过示例展示了在大量数据下算法的运行效率。
2157





