大数据
文章平均质量分 90
wxl_winston
做想做的事,过想过的生活,既可以朝九晚五,也可以浪迹天涯
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Atlas新增clickhouse类型(TYPE)并同步元数据
要想将clickhouse的元数据同步到Atlas中,首先需要定义clickhouse相关的类型(这里是参考了spark相关类型写的,具体属性可以根据自己公司实际情况进行调整,不一定所有属性都是有用的)},},},],"DataSet"],},},},},],],},},},},},},},},},},},],"DataSet"],},},},],},},},],},},},],"DataSet"],},},},},原创 2024-03-18 17:42:07 · 1300 阅读 · 1 评论 -
Apache Atlas高级搜索语法示例
from hive_table;hive_table from hive_table where name = 'xxx' or name = 'yyy' from hive_table where name = ["xxx", "yyy"] from hive_table where name LIKE '*_xxx' hive_db where name like "???dm?*" hive_column where table.name = "dim_zd原创 2023-06-21 17:22:53 · 1122 阅读 · 0 评论 -
Apache Superset产品调研
是一个开源的数据可视化和数据探索平台,它提供了一个用户友好的界面,可以轻松地创建和分享仪表板。它支持多种数据源,包括SQLAlchemy兼容的数据库、CSV文件、Apache Druid、Elasticsearch等。Apache Superset是一个基于Python编写的Web应用程序,使用Flask作为Web框架,使用React和Bootstrap作为前端UI库。后端使用SQLAlchemy进行数据库访问,支持多种关系型数据库。原创 2023-06-20 15:12:39 · 1210 阅读 · 0 评论 -
hive根据分区动态插入数据 动态分区 hive表数据迁移
今天需要将一个分区表的数据(A)迁移到另一张表(B),两个表的字段不完全一样,但是分区一样,要求迁入到B表后,原来的数据还在原来的分区里,和原来一一对应,表结构如下:A:B:A表的分区:由于分区比较多,一个分区一个分区迁肯定不现实,所以需要用到动态分区下面是迁移sql: set hive.exec.dynamic.partition=true; --开启动态分区 set hive.exec.dynamic.partition.mode=nonstrict;--允许...原创 2020-11-11 20:15:24 · 2340 阅读 · 2 评论 -
HDFS架构-元数据分析
五.HDFS架构 大多数分布式大数据框架都是主从架构 HDFS也是主从架构Master|Slave或称为管理节点|工作节点 主叫NameNode,中文称“名称节点” 从叫DataNode,中文称“数据节点” 5.1 NameNode5.1.1 文件系统 file system文件系统:操作系统中负责管理文件、存储文件信息的软件 具体地说,它负责为用户创建文件,存入、读取、修改、转储、删除文件等 读文件 =>.原创 2020-07-01 18:19:36 · 1597 阅读 · 0 评论
分享