大数据
天津飞机哥
让天下没有难学的技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Flink流处理API 使用
Flink流处理API 使用一、Source1、以kafka消息队列的数据作为来源package com.atguigu.day02;import org.apache.flink.api.common.serialization.SimpleStringSchema;import org.apache.flink.streaming.api.datastream.DataStreamSource;import org.apache.flink.streaming.api.environmen原创 2020-12-10 10:58:38 · 1235 阅读 · 0 评论 -
5 分钟搞懂布隆过滤器,亿级数据过滤算法你值得拥有!
5 分钟搞懂布隆过滤器,亿级数据过滤算法你值得拥有!在程序的世界中,布隆过滤器是程序员的一把利器,利用它可以快速地解决项目中一些比较棘手的问题。如网页 URL 去重、垃圾邮件识别、大集合中重复元素的判断和缓存穿透等问题。布隆过滤器(Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。一、布隆过滤器简介当你往简单数原创 2020-12-09 21:26:44 · 866 阅读 · 0 评论 -
Kylin
Kylin1、 简介Kylin Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。2、 Kylin的工作原理Apache Kylin的工作原理本质上是MOLAP(Multidimension On-Line Analysis Processing)Cube,也就是多维立方体分析。是数据分析中非常经典的理论,下面对其做简原创 2020-12-09 21:24:54 · 229 阅读 · 0 评论
分享