机器学习中的聚类、模型与数据处理
1. 聚类考量与似然值
在处理聚类问题时,我们需要考虑聚类的大小。假设每个聚类的概率服从高斯分布,我们要比较的衡量指标——似然值,涉及多个因素。其中,$N_c$ 除以 $N_D$ 的比值是聚类 $C$ 中的数据点相对于总数据点的比例,这个比例就是聚类 $C$ 的先验概率。第二项包含聚类 $C$ 协方差行列式的逆平方根以及包含马氏距离平方的指数因子。
2. 机器学习基础概念
- 机器学习范畴 :OpenCV 库主要处理统计机器学习问题,而非贝叶斯网络、马尔可夫随机场和图形模型等主题。
- 训练与测试数据区分 :训练数据用于模型学习,测试数据用于评估模型性能。
- 生成模型与判别模型
- 生成模型 :试图在无监督或无标记训练数据的情况下找到现有数据的结构。
- 判别模型 :从示例中学习并尝试对所看到的内容进行泛化。
3. OpenCV 中的基础工具
OpenCV 库提供了两个非常基础的工具:
- K - 均值聚类 :与高斯混合模型的期望最大化(EM)算法类似,EM 算法在 OpenCV 中以 cv::EM() 实现。
- 马氏距离 :可用于构建简单模型
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



