- 博客(7)
- 问答 (1)
- 收藏
- 关注
原创 presto学习总结(二)
presto中的组件:(1)Coordinator: 负责接收来自用户的查询语句,解析这些语句,安排执行计划,并且管理worker节点. Coordinator会跟踪每个worker的活动,并安排查询的执行,一旦接受到SQL查询,Coordinator就会负责parsing,analyzing,planning这个查询。(2)Discovery Service presto通过Discovery Service发现集群中的所有节点,worker启动的时候就会像Discov...
2021-10-12 11:50:31
527
原创 ClickHouse简介(一)
一、clickhouse产生和背景:ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的列式存储数据库(DBMS),使用 C++语言编写,主要用于在线分析处理查询(OLAP) ,能够使用 SQL 查询实时生成分析数据报告。于2016年开源,凭借优秀的性能,市场反应非常热烈。什么事列式存储数据库??相对行式数据库,像MySQL、Oracle、SqlServer等都是行式存储,是把同一行的数据放到相邻同一数据块种,而列式存储是把同一列的数据放到相邻同一数据块种,这样在进行计
2021-10-12 09:55:30
1051
原创 spark学习总结(一)
spark1.0有丰富的API,提供SQL查询、流式计算、机器学习、图计算,Spark可以跑在Yarn、 Mesos等多种调度平台, 也可以使用standalone模式或者上云。同时是基于内存的计算,比MR快100倍左右
2021-09-27 15:23:09
410
原创 presto学习(一)
一、安装presto本人使用的是mac,可以有两种方式如下:(1)通过brew方式brew cask install docker(2)官网下载桌面版Install Docker Desktop on Mac | Docker Documentation配置镜像,是通过网上找的镜像配置:(1)找到preferences将镜像配置加入,然后重启即可执行docker info有如下现实,表示镜像添加成功:开启Nginx测试:docker run -d -...
2021-09-16 14:47:58
416
原创 面试题总结
疫情期间找工作其实真的不是很好找,下面是最近一段时间的面试总结hive面试总结:一、经常会被问到的就是row_number()函数的使用(1)、用户登录日志:APP userid datetime快手 user001 2020-01-01 02:00:00电猫 user002 2020-03-01 09:12:03快手 user001 2020-01-02 02:00:00输出每个APP下访问次数最多的5个用户(快手又被问到)(2)、数据如下date u...
2020-07-07 11:13:22
290
原创 学习大数据整理的相关bug集
6-141、安装mysql时,因为多次启动mysql服务,所以会显示PID file找不到,需要查看进程ps -ef | grep -i mysql,然后kill -9 所有的进程号,然后重新启动mysql服务。2、挂载光盘时,说找不到sr0是因为在虚拟机里面没有把对应的ios镜像1加入进去。 3、在linux上部署web项目,然后在在win的浏览器上输入地址可以正常进行浏览,步骤:1、将win上...
2018-05-17 20:25:08
1723
原创 在实习期间同学问的问题的总结
11.15在控制台输出使用Scanner会比较慢,可以使用System.in.read(),再添加到数组里11.161、为什么float,long定义的变量需要加f和L,int,short等不加??答:因为float定义的如果后不加f会默认为double类型,会产生编译错误,而long 应为整数默认是int类型,向下转换不回丢失精度,向上装换回丢失精度 ,而 s
2017-03-14 10:34:42
572
空空如也
Hadoop二级缓存是怎么实现的
2016-11-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅