- 博客(8)
- 收藏
- 关注
原创 层次聚类 AGNES
(3)linkage:选用的距离标准,{'ward','complete','average''single'},:'wrad'指按照最小方差合并簇,'complete','average','single'分别代表按照最大距离、平均距离和最小距离计算簇之间的距离。(2) labels _: ndarray of shape(n_samples),每一个点的簇标记。(2)affinity:表示距离度量的字符串,默认值为'euclidean';(1)n_clusters _: int,算法得出的簇的数目。
2024-06-16 13:13:20
269
原创 密度聚类-DBSCAN
(2) components _: ndarray of shape(n_core_samples,n_features),训练得出的每一个核心元素构成的副本。(1) core_sample_indices _: ndarray of shape(n_core_samples,),核心元素的索引。(3) labels _: ndarray of shape(n_samples):每一个点对应的标签,噪声点在最后。(2)min_samples:邻域中至少要包含最小数数目(MinPts),默认值为5;
2024-06-16 13:08:04
518
原创 k均值聚类
(3)n_init:初始化次数,设为10意味着进行10次随机初始化,选择效果最好的一种来作为模型;(4)init='k-means++' 会由程序自动寻找合适的n_clusters;(5) tol:float型,默认值=1e-4,与inertia结合来确定收敛条件;(2)max_iter:算法执行的最大迭代次数,这里设置最大迭代次数为300;(1)n_cluster:需要给定的类别个数,默认值为8;(6)n_jobs:指定计算所用的进程数;
2024-06-16 12:49:42
720
原创 主成分分析PCA
n_components:这个参数可以设置为一个大于等于1的整数,表示数据降到的维数。也可设置为一个(0,1]之间的数,用于设定主成分累积贡献率的阈值,让PCA类自己去根据样本特征方差来决定降维到的维度数。svd_solver:有4个可以选择的值:{'auto','full','arpack','randomized'},一般来说,使用默认值就够了。newX=pca.fit_transform(X),newX就是降维后的数据。用X来训练PCA模型,同时返回降维后的数据。将降维后的数据转换成原始维度的数据,
2024-06-16 12:33:12
1320
原创 第七章 线性判别分析LDA(7.1)
score(X,y[,sample_weight]):返回(X,y)上的预测准确率(accuracy)。predict_log_proba(X):返回一个数组,数组的元素一次是X预测为各个类。predict_proba (X):返回一个数组,数组元素一次是x预测为各个类别的概。priors:一个数组,数组中的元素依次指定了每个类别的先验概率。covariance _: 一个数组,依次给出了每个类别的协方差矩阵。means _: 一个数组,依次给出了每个类别的均值向量。fit(X,y):训练模型。
2024-06-15 18:20:17
737
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅