数据分类与实时视频流分析
数据分类研究
数据分类通常分为三个阶段:训练集、确定类属性和目标。所获取的数据一般会被分为训练集和测试数据两部分,为了实现准确预测,常采用10折交叉验证技术。
本次研究选取了四个不同的数据集,分别是肝脏疾病、肝病患者检测、葡萄酒和乳腺癌数据集,这些数据集均来自UCI仓库(链接:https://archive.ics.uci.edu/ml/datasets.html )。应用的分类算法包括决策树及其三个子算法(支持向量机、精细树、粗糙树、中等树)、逻辑回归分类器及其子算法(立方SVM、线性SVM、高斯SVM、二次SVM、精细SVM、粗糙SVM)以及集成分类器及其子算法(破碎树和袋装树)。
算法介绍
- 决策树 :决策树分类算法在处理和映射问题方面有很大潜力,但相对于更可预测的模式识别技术(如极大似然分类),尚未得到远程识别领域的详细验证。
- 逻辑回归分类器 :这是一种用于二元分类问题的机器学习技术,其核心基于逻辑函数,类似于线性回归,用于建模默认类的概率。
- 支持向量机 :是最受关注和使用的分类器之一,在20世纪90年代极为流行,至今仍被广泛应用。它通过一个分离超平面进行分类。
- 集成分类器 :由至少两个分类器组合而成。与单一理论模型相比,集成学习能产生更高质量的结果。增量学习算法即使在分类器已经生成后,仍能从新出现的实例中学习,且能保留已获取的信息。
超级会员免费看
订阅专栏 解锁全文
1748

被折叠的 条评论
为什么被折叠?



