数据分析及数据挖掘
文章平均质量分 91
杜之心
有些问题,需要喝杯茶才能解决。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
atlas 1.2 编译,安装和配置集成hive(依赖外部hbase es)
1.下载 sourcehttp://atlas.apache.org/Downloads.htmlwgethttps://mirrors.tuna.tsinghua.edu.cn/apache/atlas/1.2.0/apache-atlas-1.2.0-sources.tar.gz2.编译安装maven,修改maven setting.xml,添加aliyun 镜像配置阿里云镜像,在下图位置(<mirrors>内配置如下代码),保存退出<mirror>..原创 2021-02-26 18:20:17 · 1024 阅读 · 0 评论 -
离线计算,实时计算和流式计算的概念区分
离线计算:这个大家都能理解,今天早上一点,把昨天累积的日志,计算出所需结果。一般累积时间较长,计算量级较大,计算时间也较长。实时计算:与离线计算相比,运行时间短,(人可以等待的时间)。(冗余+高性能部件,及算法的优化),计算量级相对较小。强调计算过程的时间要短,即所查当下给出结果。流式计算:与实时计算相比,时效稍微慢些,实时计算是以主动查询来触发,流失计算是以事务发生及结果变更为触发。强调不累积日原创 2017-07-10 10:04:33 · 5386 阅读 · 1 评论
分享