NearestNeighbors类
功能:不直接进行分类或回归,而是返回样本的最近邻索引和距离,因此它是一个无监督的学习方法。
参数
n_neighbors : int, default=5;选出距离最近的几个样本,默认是5个,这个类的方法kneighbors默认使用这个参数。
radius : float, default=1.0;这个类的方法radius_neighbors默认使用这个参数。
algorithm : {'auto', 'ball_tree', 'kd_tree', 'brute'}, default='auto',用于查询最近邻的算法,只是给赋予数据一种结构,这样能快速查询距离测试样本最近的数据。
leaf_size : int, default=30;叶子节点的数据点的最大数量。默认为30,如果最大数量设置得较小,树会划分得更细致,深度可能会更深,节点数量也会更多,这样树的结构会更复杂。相反,如果最大数量设置得较大,树的划分会相对粗糙,深度会变浅,节点数量减少,树的结构更简单。较小的最大数量会使树的构建时间增加,因为需要进行更多的划分操作