
分类算法
文章平均质量分 68
海滩上的那乌克丽丽
I can because i believe i can.
展开
-
朴素贝叶斯算法
朴素贝叶斯的前提是特征独立贝叶斯公式是用来描述两个条件概率之间的关系公式可以理解为举例:计算过程拉普拉斯平滑如果词频列表里面有很多次数是0,有可能计算结果为0,拉普拉斯平滑解决分类后某一概率为0的问题。加上拉普拉斯平滑系数后结果就不会变成0from sklearn.datasets import fetch_20newsgroupsfrom sklearn.model_selection import train_test_spl...原创 2022-03-19 11:34:56 · 1394 阅读 · 0 评论 -
聚类算法介绍(欧氏距离和余弦距离)
1.聚类就是将数据集划分为若干相似对象组成的多个组或簇的过程,使得同一个组或簇相似度最大化,不同簇间相似度最小化。(有时候聚类可以评价相似性)2.聚类的本质是分组,属于无监督机器学习。3.在聚类分析中,样本之间相似性通常采用样本之间的距离来表示,距离越大表示两个样本越不相似,差异性越大。距离越小,样本差异性越大,距离为零表示两个样本完全一样,无差异。4.连续型数值计量方法最常用的是欧氏距离(l2范数,两点之间直线距离)曼哈顿距离(l1范数,两点之间台阶式距离)5.如果数据是.原创 2022-03-10 19:02:02 · 10041 阅读 · 0 评论