数据分类分析
监督学习
基本概念
分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到预先定义的类标号y。
一般方法
- 决策树分类法
- 基于规则的分类法
- 神经网络
- 支持向量机
- 朴素贝叶斯分类法
均采用一种学习算法(learning algorithm)确定分类模型
主要目标 :建立一个具有很好的泛化能力的模型,即能正确预测未知样本类标号的模型。
无监督学习
聚类分析
(无监督分类)是一个把数据对象划分成子集的过程,每个子集都是一个簇(cluster),使得簇中的对象彼此相似,但与其它簇中的对象不相似。组内的相似性越大,组间的差别越大,聚类就越好。
聚类方法
- 划分方法
- 层次方法
- 基于密度的方法
- 基于网格的方法
- 基于模型的方法
数据科学之旅:监督与无监督学习方法解析
本文深入探讨了监督学习中的决策树、规则、神经网络、SVM和朴素贝叶斯等分类技术,同时揭示了无监督学习中的聚类分析,如划分、层次和密度方法。掌握这些方法有助于创建高效泛化的模型,实现数据智能分类。
2247

被折叠的 条评论
为什么被折叠?



