自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 离线仓库ODS-DWD-DWS-ADS

离线数仓分层设计

2024-05-17 14:57:54 1203

原创 统计MySQL的数据库和表

- MySQL中列出所有库以及每个库所有的表。-- 统计各个数据库的表数量。

2024-05-17 11:14:15 186

原创 浅谈离线数仓ADS层

ads层离线数仓字段获取实现原理

2024-05-17 10:01:14 558

原创 入门了解离线数仓这一篇就够了

入门了解离线数仓

2024-05-17 09:19:19 369

原创 学MySQL的group by这一篇就够了·

一篇对MySQL的group by的讲解!!!

2024-05-17 09:04:55 941

原创 企业《离线数仓项目》数据探索心得记录,数据探索有套路

离线数仓数据探索思想

2024-05-16 13:12:57 253

原创 MySQL建表时用关键字作为字段报错解决方案

解决MySQL建表时用关键字作为字段的解决方案

2024-05-14 16:36:44 515

原创 MySQL表突然卡死,删、查操作加载不停解决办法

解决锁表、卡死的解决方法。

2024-05-14 16:08:39 886

原创 centos7.6挂载磁盘时候报错解决办法

解决移动硬盘挂载不到centos7上面,exfat报错问题

2024-05-14 09:32:36 585

原创 集团真实《离线数仓》项目回顾总结

其中每一个公司都有属于自己的业务系统,系统所产生的数据会存储到该公司的数据库中,而不同系统所用的数据库不同,也就是我们数仓的数据来源,其中包括:MySQL、SqlServer2000、SqlServer2014、Oracle、hive等这些数据库服务。其次,需要对业务数据和系统进行关联探索,探索哪一步业务对应哪一个系统,哪些一步业务对应哪些数据和表。分析需求---对业务以及业务数据探索---(测试/生产)环境部署---数仓建模---ETL清洗、转换、推送数据---数据应用。5、ETL清洗、转换、推送数据。

2024-05-11 23:41:53 423 1

原创 Kettle工具出现预览数据类型不一致问题:在使用kettle以sqlserver2000做为输入表,MySQL作为输出表时,sqlserver所预览的数据类型与实际表中数据类型不同

解决kettle数据预览不一致问题

2024-05-11 22:02:05 600 1

原创 企业级数据备份案例:企业工作日记记录,大数据备份恢复一致性校验

本文讲解了我在企业工作时遇到需要进行数据备份以及恢复MySQL数据的过程,包括了问题出现和解决的过程。

2024-05-10 13:33:46 510

原创 史上最简单教程Centos7在线安装部署docker

您的鼓励是我最大的动力,我也会将更多技术文章毫无保留的跟大家分享,希望大家能一起进步!更新 yum。

2024-05-10 11:27:56 331

原创 史上最全保姆级教程Centos7从安装redis到卸载redis

保姆级教程从centos7安装redis到卸载redis

2024-05-08 09:20:40 2442 1

原创 史上最简单的配置Centos7 固定静态ip

史上最简单的配置静态IP

2024-05-08 08:57:14 288 1

原创 史上最简单安装Maven教程

Centos7安装Maven教程一、下载安装1.创建 /usr/local/maven 目录进入 /usr/local/maven 目录,并下载 apache-maven-3.6.32.下载Maven的离线tar.gz包3.或者在线下载4.解压 apache-maven-3.6.3-bin.tar.gz5.配置环境配置环境变量,在末尾添加以下内容在配置文件中粘贴上去加载配置查看是否可用mvn -v。

2024-05-07 10:05:51 468

原创 保姆级最全Centos7.6 JDK的在线和离线安装部署

JDK1.8超详细环境部署,此文章手把手教您部署学习过程中或企业工作中要用到的JDK1.8,从安装软件到环境配置!

2024-05-06 15:21:07 1213 3

原创 spark Scala中dataframe的常用关键字:withColumn

在withColumn的第二个参数传入正则匹配将“·”后面的数据替换成空。如果第一个参数传入的列名和第二个参数传入的列名参数相同的话,就会替换原来的列。如果第一个参数和原列名参数不同,则会追加新增加一列数据在表后面。在withColumn的第二个参数传入正则匹配将“·”后面的数据替换成空。withColumn关键字:用于向现有的DataFrame添加一个新的列,或替换一个现有的列!该参数传入的是操作dataframe表中指定。数据进行操作,最后返回一个。思路是将city字段数据“

2023-03-30 12:07:38 2483

原创 hive的metastore服务不开启,依然可以连接使用Mysql数据库中的元数据!

后来才突然明白了hiveserver2和metasore的配置文件都在同一个hive-site.xml中进行配置的,我把hive默认的Derby数据库改成了Mysql数据库来存储hive需要的元数据,将连接Mysql的四要素(URL、Driver、User、PassWord)配置到了hive-site.xml当中就可以连接MySQL了。

2023-03-26 12:34:07 631

原创 解释hive为什么是Hadoop的客户端

上面这段话可以总结出,hive用到了Hadoop中的三件套,HDFS、Yarn、MapReduce!因为hive用到了Hadoop的三件套(HDFS、Yarn、MapReduce)!中形成一张表进行SQL查询,而且hive写的sql语句会翻译成。所以说hive是Hadoop的客户端,而Hadoop是服务端!hive会将结构化的数据映射到。计算任务来执行,hive执行时会将任务交由。

2023-03-25 22:37:57 291

原创 常用DOS命令

常见的DOS命令

2022-10-04 13:39:31 134

原创 大学开启大数据开发之路

去年便下的决定,走编程这条路,也坚持了一年多了,发现有很多东西要学到,最近学了不少技术,不过还不能熟练的掌握所学到的技术,比如Java基础知识、python基础、Linux操作系统基础知识、SQL语句、最后还学了点Java的数据结构和算法,确实花了两个月时间学了很多,可能是实践得少,没有完全能灵活运用这些技术,接下来准备开始学习Hadoop,需要把该学的技术大致的学过一遍,再慢慢深入去学习和实践之前学过的技术吧,果然大学所学到的理论知识多了,实践却少了许多。 听说框架更新的很快,我们需要学的不仅仅是.

2022-05-10 01:38:31 435

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除