
Data Mining
雨落
学习云计算、web开发、分布式数据库、android开发!
展开
-
做数据挖掘的步骤
1. 理解业务与理解数据; 2. 获取相关技术与知识; 3. 整合与查询数据; 4. 去除错误或不一致及不完整的数据; 5. 由数据选取样本先行试验; 6. 建立数据模型 7. 实际Data Mining的分析工作; 8. 测试与检验; 9. 找出假设并提出解释; 10. 持续应用于企业流程转载 2012-01-17 14:00:30 · 362 阅读 · 0 评论 -
十大数据挖掘算法及各自优势
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法,转载 2012-01-17 14:04:50 · 385 阅读 · 0 评论 -
mahout in action 1 初识Mahout
http://running.iteye.com/blog/914775 本章内容: .什么是mahout .初识推荐引擎,聚类,分类在现实生活 .建立mahout 你们可能已经从标题中猜出,这本书是关于一个特定的工具Mahout,在现实生活中使用。那么什么是mahout? Mahout是一个Apache的开源机器学习项目。该算法属于广阔的 “机器学习转载 2012-01-20 10:23:25 · 761 阅读 · 0 评论 -
基于云计算平台的并行数据挖掘
转自:http://bbs.sciencenet.cn/home.php?mod=space&uid=425672&do=blog&id=321016 采用云计算技术,实现海量数据的存储、分析、处理、挖掘,提供高可靠性、高性能的数据挖掘分析。 从系统架构来讲,基于云计算的并行数据挖掘工具平台包括三个层次,依下而上为 分布式计算层;数据挖掘平台层;业务应用层 (1)分布式计算转载 2012-04-06 21:31:32 · 560 阅读 · 0 评论 -
从决策树学习谈到贝叶斯分类算法
转自:http://blog.youkuaiyun.com/v_july_v/article/details/7577684 第一篇:从决策树学习谈到贝叶斯分类算法 引言 最近在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道的几种分类或转载 2012-05-19 02:10:12 · 2983 阅读 · 0 评论 -
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值原创 2012-08-27 16:52:38 · 906 阅读 · 0 评论