- 博客(6)
- 收藏
- 关注
原创 硬刚Hive | 4万字基础调优面试小总结
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反应历史变化(Time Variant)的数据集合,用于支持管理决策。数据仓库体系结构通常含四个层次:数据源、数据存储和管理、数据服务、数据应用。数据源:是数据仓库的数据来源,含外部数据、现有业务系统和文档资料等;
2023-07-20 11:51:34
383
1
原创 superset过滤器中,日期下拉框自动化转成时间戳问题
修改superset\utils\core.py 里面的json_int_dttm_ser函数,注释掉obj = (obj - EPOCH.date()).total_seconds() * 1000,更改为 obj = obj.strftime("%Y/%m/%d")
2023-06-15 13:12:36
1145
1
原创 HADOOP多个DFS目录中有一个磁盘空间超过90%解决(USED SPACE ABOVE THRESHOLD OF 90.0%)
根据我生成文件,所以我执行的命令是: hdfs diskbalancer -execute /system/diskbalancer/2020-十月-19-18-07-40/node3.plan.json。根据第一步生成的json文件,我生成的json名称为:/system/diskbalancer/2020-十月-19-18-07-40/node3.plan.json。我平衡的是node3,所以我的命令是:hdfs diskbalancer -query node3。PLAN_DONE 表示完成。
2023-05-29 09:55:57
889
1
原创 CentOS7解决yum命令doesn‘t have enough cached
第四步:如果第三步仍然报错,那就进入 /etc/yum.repos.d ,编辑vi CentOS-Base.repo,修改下面黄色标识的部分(只需要注释掉第一行,取消注释第二行),要修改4处。第六步:当然,报错的方法有很多,如果上述方法不能解决问题,建议在搜索一下其他解决方案;第二步:vi /etc/resolv.conf,添加下面一行:nameserver 114.114.114.114。第五步:再次执行 yum update就可以执行 yum 命令了。第三步:修改完后执行一下yum update命令。
2023-05-15 11:04:52
690
1
原创 superset连接hive整个过程(详细)以及过程中的各种报错解决方法比如错误User: tom is not allowed to impersonate tom等等
测试连接hive的时候,一直报错,不能获取192.168.10.104下面的数据,所以我们此时应该重启superset或者关掉superset、关闭hadoop集群,再开启hadoop、superset、登录superset即可。测试连接成功,之后在superset上面可视化的时候,执行mapreduce任务的时候,因为内存不够,从而kill掉了mapreduce进程。对于这个问题一般情况下,只修改core-site.xml就可以解决问题,解决拒绝连接的问题。(1)修改hive-site.xml。
2023-04-10 18:36:19
2000
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人