机器学习与数据挖掘
文章平均质量分 80
Maneck
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第三章、数据预处理
3.1 为什么需要预处理n 数据• 不完整,含噪声,不一致n 数据清理通过填写空缺值,平滑噪声数据,识别删除孤立点,并解决不一致来清理数据。脏数据形成的原因n 滥用缩写词n 数据输入错误n 数据中的内嵌控制信息n 不同的惯用语(如:ASAP对“at firstchance”)n 重复记录n 丢失值n 拼写变化n 不同的计量单原创 2014-11-20 17:43:28 · 794 阅读 · 0 评论 -
PageRank算法简介及Map-Reduce实现
本文转自PageRank算法简介及Map-Reduce实现 PageRank对网页排名的算法,曾是Google发家致富的法宝。以前虽然有实验过,但理解还是不透彻,这几天又看了一下,这里总结一下PageRank算法的基本原理。什么是PageRank PageRank的Page可是认为是网页,表示网页排名,也可以认为是Larry Page(google 产品经理),因为他是这个算法的发明者之一,还转载 2015-05-26 18:11:24 · 561 阅读 · 0 评论
分享