数据分类分析——监督学习与无监督学习

本文深入探讨了监督学习中的决策树、规则、神经网络、SVM和朴素贝叶斯等分类技术,同时揭示了无监督学习中的聚类分析,如划分、层次和密度方法。掌握这些方法有助于创建高效泛化的模型,实现数据智能分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分类分析

监督学习

基本概念

分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到预先定义的类标号y。

一般方法

  • 决策树分类法
  • 基于规则的分类法
  • 神经网络
  • 支持向量机
  • 朴素贝叶斯分类法

均采用一种学习算法(learning algorithm)确定分类模型
主要目标 :建立一个具有很好的泛化能力的模型,即能正确预测未知样本类标号的模型。

无监督学习

聚类分析

(无监督分类)是一个把数据对象划分成子集的过程,每个子集都是一个簇(cluster),使得簇中的对象彼此相似,但与其它簇中的对象不相似。组内的相似性越大,组间的差别越大,聚类就越好。

聚类方法

  • 划分方法
  • 层次方法
  • 基于密度的方法
  • 基于网格的方法
  • 基于模型的方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值