
数据挖掘
timothyzh
大家好!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘的类型定义
一、从数据分析(data analysis)讨论 预测问题(prediction problems)的两个主要类型是分类(classification)和数值预测(numeric prediction)。 这些问题都会涉及到训练数据集(training dataset)。从数据库的角度看,数据集中的每个元素称作训练元组(training tuple);而在机器学习中,这些元素则称为训练样原创 2010-07-22 06:58:00 · 1117 阅读 · 0 评论 -
关联规则挖掘的相关概念
一、关联规则的概念 关联规则(association rules)就是从frequent patterns中发现的规律。而frequent patterns就是在数据集中频繁出现的patterns(例如,itemsets, subsequences, substructures)。在实际的association rules挖掘中,有以下几个基本定义: 1. session:有1个unique原创 2010-07-31 09:19:00 · 1576 阅读 · 0 评论 -
数据分析和挖掘性能的一些概念
1. 混淆矩阵和统计量 用缩写分别表示图中各个单元格中表示的个体数量, TP: true positives FP: false positives FN: false negatives TN: true negatives 另外,还有表示实际类别的个体数量, P: positive samples = TP+FN N: negative samples = FP+TN 最原创 2010-07-18 13:29:00 · 2977 阅读 · 1 评论