
大数据之辅助工具
ETL过程工具、中间件
大数据架构师Pony
不勤于始,将悔于终。
展开
-
FineBI开启关闭缓存方式
模式二选择固定时间点进行缓存,如表达式设置为0408,9,14**?表示8点40分,9点40分,14点40分,分别进行缓存一次。按照下面1~4步骤即可开启关闭缓存,刷新数据。(注意这是全部刷新,如果数据没有变化,需要单个页面先进行清除缓存操作!模式一选择固定时间段缓存,如每隔720分钟即12小时缓存一次,简单重复执行设置为720;图二中即为缓存进一步设置方式两种模式选择。...原创 2022-08-01 13:51:44 · 1556 阅读 · 0 评论 -
sqoop could not load db driver class:oracle.jdbc.OracleDriver_
报错如图,在使用sqoop从oracle导数到hive,加载不到驱动。原因:缺少包解决:在安装sqoopserver的节点上放oracle的驱动包,/opt/cloudera/parcels/CDH/lib/sqoop/lib/ojdbc6.jar并且修改权限为777...原创 2021-12-09 13:53:39 · 2475 阅读 · 0 评论 -
oozie调度在hue上,报错:no such file or directory
原因:workflow.xml编码格式不对解决:workflow.xml编码格式由Windows改为unix原创 2020-09-10 09:46:39 · 481 阅读 · 0 评论 -
redis缓存穿透和缓存雪崩的原因和解决办法
缓存穿透:缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。解决方案:布隆过滤器布隆过滤器是一种数据结构,垃圾网站和正常网站加起来全世界据统计也有几十亿个。网警要过滤这些垃圾网站,总不能到数据库里面一个一个去比较吧,这就可以使用布隆过滤器。假设我们存储一亿个垃圾网站地址。转载 2020-05-31 20:55:22 · 578 阅读 · 0 评论 -
使用java API对redis进行访问
首先下载redis的源码包解压启动服务端和客户端保证服务已经启动。-------------------------------------------------------------------命令 -----------------查看启动状态 ...原创 2020-03-01 16:50:21 · 375 阅读 · 0 评论 -
一款优秀的--主流的--数据库--redis初认识
redis是什么?redis是一个key-value存储系统。官网:https://redis.io/特点:(优点)高效率: redis读取的速度大约是11w次/s, 写的速度大约8.1w次/s 原子性: redis的所有操作都是原子性的, 同时redis还支持对几个操作全并后的原子性执行 支持多种数据结构: string(字符串) list(列表|队列) hash(哈希) se...原创 2020-03-01 16:34:03 · 138 阅读 · 0 评论 -
canal监控mysql变化的问题-NoNode for /otter/canal/destinations/example/cluster
原因:没有节点解决:到canal的安装目录下面,查看canal的配置文件,发现没有指定canal.zkServers的地址!canal.properties原创 2020-10-11 21:11:56 · 1314 阅读 · 0 评论 -
如何使用redis,或者zookeeper实现分布式锁
分布式锁的概念:部署了多个tomcat应用,在执行定时任务时就会遇到同一任务可能执行多次的情况,我们可以借助分布式锁,保证在同一时间只有一个tomcat应用执行了定时任务。分布式锁的实现方式有四种:使用redis的setnx()和expire()setnx(key,value)如果key不存在,设置为当前key的值为value;如果key存在,直接返回。expire()来设置超时时间使用redis的getset()此方法使redisTemplate.boundValueOp...原创 2020-05-24 23:22:53 · 214 阅读 · 0 评论 -
canal监控mysql数据库数据变化的巨坑!!
原理:canal监控mysql的数据库数据变化是根据数据库的binlog来监控的。问题描述:使用canal监控mysql数据库数据变化时,总是监控不到。解决:一路排查问题,确认不是其它问题后,去确认vim /etc/my.cnf 这个文件。添加上面三行,再次重启mysql。删除meta.data,重启canal,问题解决。meta.data文件,此文件记录了canal读取的日志文件的信息,测试,问题解决!查看监控的信息目录下 :/export/servers...原创 2020-06-19 14:05:07 · 4862 阅读 · 2 评论 -
flume负载均衡案例
1.node01上配置:exec-avro.conf#agent1 nameagent1.channels = c1agent1.sources = r1agent1.sinks = k1 k2#set gruopagent1.sinkgroups = g1#set channelagent1.channels.c1.type = memoryagent1.channel...原创 2020-02-10 18:04:19 · 374 阅读 · 0 评论 -
利用flume监控目录下生成日志并设置间隔时间生成日志的详细操作
先确认环境配置好,能正常监听! 新建目录:/root/logs 在/flume/conf目录下新建配置文件tail-hdfs.conf# Name the components on this agenta1.sources = r1a1.sinks = k1a1.channels = c1# Describe/configure the sourcea1.sources....原创 2020-02-09 16:52:05 · 1018 阅读 · 0 评论 -
azkaban启动错误
启动azkaban错误原创 2020-02-11 19:55:36 · 1264 阅读 · 0 评论