74、机器学习中的聚类、模型与数据处理

机器学习中的聚类、模型与数据处理

1. 聚类考量与似然值

在处理聚类问题时,我们需要考虑聚类的大小。假设每个聚类的概率服从高斯分布,我们要比较的衡量指标——似然值,涉及多个因素。其中,$N_c$ 除以 $N_D$ 的比值是聚类 $C$ 中的数据点相对于总数据点的比例,这个比例就是聚类 $C$ 的先验概率。第二项包含聚类 $C$ 协方差行列式的逆平方根以及包含马氏距离平方的指数因子。

2. 机器学习基础概念
  • 机器学习范畴 :OpenCV 库主要处理统计机器学习问题,而非贝叶斯网络、马尔可夫随机场和图形模型等主题。
  • 训练与测试数据区分 :训练数据用于模型学习,测试数据用于评估模型性能。
  • 生成模型与判别模型
    • 生成模型 :试图在无监督或无标记训练数据的情况下找到现有数据的结构。
    • 判别模型 :从示例中学习并尝试对所看到的内容进行泛化。
3. OpenCV 中的基础工具

OpenCV 库提供了两个非常基础的工具:
- K - 均值聚类 :与高斯混合模型的期望最大化(EM)算法类似,EM 算法在 OpenCV 中以 cv::EM() 实现。
- 马氏距离 :可用于构建简单模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值