机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)
均值偏移(mean shift
)是一个非参数特征空间分析技术,用来寻找密度函数的最大值点。它的应用领域包括聚类分析和图像处理等。
均值偏移算法
均值偏移是一个迭代地求密度函数极值点的方法。首先,从一个初始估计 xxx 出发。这里要给定一个核函数 K(xi−x)K(x_i-x)K(xi−x), 典型采用的是高斯核。核函数用来确定 xxx 的邻近点的权,而这些邻近点用来重新计算均值。这样,在 xxx 点的密度的加权均值
m(x)=∑xi∈N(x)K(xi−x)xi∑xi∈N(x)K(xi−x)m(x)=\dfrac{\sum_{x_i\in N(x)}K(x_i-x)x_i}{\sum_{x_i\in N(x)}K(x_i-x)}m(x)