KMeans是orange中提供的一个用来聚类的类,它是标准k-means的实现。
初始化:
__init__(data=None, centroids=3, maxiters=None, minscorechange=None, stopchanges=0, nstart=1,initialization=kmeans_init_random, distance=orange.ExamplesDistanceConstructor_Euclidean, scoring=score_distance_to_centroids, inner_callback = None, outer_callback = None, initialize_only = False)
参数说明:
Data:输入的数据
centroids:即k的值
maxiters:最大迭代次数,停止聚类的条件之一。如果不想让迭代次数过多,可指定此参数
minscorechange: 停止聚类的条件之一,如果不指定,则不会计算2次迭代之间的评分
stopchanges:停止聚类的条件之一nstart:指定计算次数,不是迭代次数
distance:使用的距离,默认为欧氏距离

博客介绍了如何在Orange数据挖掘库中应用KMeans聚类算法。内容涵盖KMeans类的初始化参数及其作用,如数据输入、k值设定、距离度量等。还展示了设置回调函数来跟踪迭代过程,并提到了在大数据集上可能遇到的问题,即Orange在样本数量超过25k时可能出现异常,不适用于大规模数据处理。
最低0.47元/天 解锁文章
1341

被折叠的 条评论
为什么被折叠?



