大数据
文章平均质量分 57
了解大数据专栏
小菜鸡0626
就是为了及时行乐
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
FlinkSQL通解
根据指定的表名创建一个表,如果同名表已经在CataLog中存在了,则无法创建。<physical_column_definition>: -- 物理列定义}[, ...]常规列即物理列,定义了物理介质中存储的数据中字段的名称、类型与顺序。其他类型的列也可以在物理列之间进行声明,但是不会影响最终物理列的读取。形式举例) WITH (...rowtime_column_name:表的事件时间属性字段。原创 2025-07-13 10:29:30 · 1154 阅读 · 0 评论 -
集群-时钟同步操作
集群-时钟同步操作 为什么需要时间同步? 很多分布式系统是有状态的,比如说存储一个数据,A节点与b节点可能会出现时间不一致现象,而导致数据丢失问题。 两种办法: 办法一: 将一个主机设置为标准时间,其他主机都与之时间相适应。 办法二: 通过网络,所有的主机与时间同步服务器保持同步。 # 安装 yum install -y ntp # 启动定时任务 crontab -e 之后输入界面 */1 * * * * /usr/sbin/ntpdate btp4.aliyun.com原创 2021-03-10 17:33:44 · 249 阅读 · 0 评论 -
Hadoop-伪分布环境
Hadoop-伪分布环境 下载 下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-2.9.2/ 将下载好的文件,通过XFTP传到服务器。 解压 配置环境变量 export HADOOP_HOME=/software/hadoop export HADOOP_INSTALL=$HADOOP_HOME export HADOOP_MAPRED_HOME=$HADOOP_HOME export HADOOP_COMMON_HOME=$HADOOP原创 2021-03-10 17:32:32 · 171 阅读 · 0 评论
分享