
数据挖掘
bxg1065283526
希望现在开始为时不晚,努力一定会有收货
展开
-
大数据分类技术
博客内容是根据北邮牛博老师的PPT整理所得一、认识分类分类的目的是获得一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到某一个给定类别。 分类可用于提取描述重要数据类的模型或预测未来的数据趋势 分类与预测的辨析• 分类是预测分类(离散、无序的)标号• 预测是建立连续值函数模型 分类的实现• 构建模型:预设分类类别• 对...原创 2018-04-16 22:12:05 · 7985 阅读 · 0 评论 -
大数据聚类技术
1.聚类的基本有关概念聚类分析:将物理或抽象对象的集合分成相似的对象类的过程称为聚类。簇:数据对象的集合,对象与同一簇中的对象批次相似,而与其他簇中的对象相异。无监督学习:没有事先定义好的类典型应用:①作为获得数据集中数据分布的工具②作为其他数据挖掘算法的预处理步骤2.聚类方法的分类①基于划分的聚类(partitioning methods):给定一个由n个对象组成的数据集合,对此数据集合构建k个...原创 2018-03-22 11:22:31 · 19997 阅读 · 0 评论 -
大数据预处理技术
学习了牛琨老师的课程后整理的学习笔记,用于日后复习一、大数据预处理的几个步骤1.数据预处理 2.数据清洗 3.数据集成 4.数据归约 5.数据变换 6.数据离散化 7.大数据预处理二、数据预处理现实中的数据大多是“脏”数据:①不完整 缺少属性值或仅仅包含聚集数据②含噪声 包含错误或存在偏离期望的离群值 比如:salary=“-10”,明显是错误数据③不一致 用于商品分类的部门编码存在差异 比如a...原创 2018-03-19 23:00:26 · 44375 阅读 · 4 评论