
数据分析和科学
文章平均质量分 76
数据分析的指标
太白山鹰
数风流人物,据比特世界
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive/spark分析函数介绍(转载)
窗口函数应用场景:(1)用于分区排序(2)动态Group By(3)Top N(4)累计计算(5)层次查询 一、分析函数用于等级、百分点、n分片等。函数 说明 RANK() 返回数据项在分组中的排名,排名相等会在名次中留下空位 DENSE_RANK() 返回数据项在分组中的排名,排名相等会在名次中不会留下空位 NTILE() ...转载 2019-01-16 14:41:32 · 630 阅读 · 0 评论 -
评价机器学习模型的三大指标:准确率、精度和召回率
向于使用准确率,是因为熟悉它的定义,而不是因为它是评估模型的最佳工具!精度(查准率)和召回率(查全率)等指标对衡量机器学习的模型性能是非常基本的,特别是在不平衡分布数据集的案例中,在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。GitHub 地址:https://github.com/WillKoehrsen/Data-Analysis/blob/master/recall_prec...翻译 2019-03-07 15:08:04 · 10459 阅读 · 0 评论 -
浅谈传统数据仓库在互联网时代的发展方向
数据仓库最早是90年代流行于美国,Bill Inmon最先提出了数据仓库的概念,其专著《建立数据仓库(第一版)》明确指出数据仓库是一个具有如下特征的数据的集合:面向主题的、集成的、非易失的且随时间变化 ,同时是为决策支持服务的。1.2000-2012年 ,数据仓库这个在00年逐渐在国内火起来的,这个时候国内的电信和银行企业积累了一定的数据,希望这些数据能够为经营分析做一些决策支持,因...原创 2019-08-07 14:06:12 · 688 阅读 · 0 评论