朴素贝叶斯算法
- 朴素贝叶斯:简单的说就是计算某个东西在一堆样本中的概率。
举个栗子:有两堆词库,一堆词库里面存着好评的词组出现的概率。一堆词库存着差评的词组出现的概率。 现在给你一句话,让你计算出这句话是好评还是差评。那么就可以首先把这句话拆分,然后计算拆分出来的词组对应的好评和差评的概率是多少。最后把词组中好评的概率和好评的概率相乘。差评和差评的概率相乘。两者的值相除计算出是否倾向于好评还是差评。这就是朴素贝叶斯算法。
knn算法
- knn算法:就是计算一个样本数据,更加倾向于哪一类数据。
举个栗子:下面有A,B两堆数据。现在要计算出任意的一点(x,y).求出(x,y)是属于哪一堆的。通过公式
就可以计算出距离哪一堆更近。三维,四维的同理。这就是knn算法。