
Data Mining
没有水杯和雨伞的工科男
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LOF-Local Outlier Factor
摘要: Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et.al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。 大神的文章:https://blog.youkuaiyun.com/wangy...原创 2018-08-21 22:02:05 · 535 阅读 · 0 评论 -
Data Science--数据预处理
ps,第一章的内容由于是科普性的内容,我就暂且没有对其进行相关概念的整理 Chapter 2 数据的预处理 数据预处理是指在对数据进行正式处理计算前 ,根据后续计算的需求对原始数据进行审计、清洗、变换 2.1 数据质量 对数据质量的三个描述:正确性、完整性、一致性 2.1.1 统计学规律 (1)第一数字定律:表示人们在使用数字的使用具有一定的使用的规律,防止出现编造数据 (2)小概...原创 2018-09-14 17:14:50 · 1203 阅读 · 1 评论