自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 01_kmeans/DBSCAN/层次算法概述

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-08-14 16:21:37 294 1

原创 flink+clickhouse玩转企业级实时大数据开发(1)

离线数据:batch 有界 静态的数据集。实时/流数据: 连续 无界 动态的数据集。

2023-05-11 17:59:01 3372

原创 大数据之路系列之FinkSql(14)

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-27 17:29:35 409

原创 Elastic Stack从入门到实践(2)

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-24 15:31:18 246

原创 大数据之路系列之kafka(11)

简称MQ,消息加队列,就是保存消息的队列,术语消息传输过程中的容器是分布式帆布订阅消息系统,每秒百万消息的生产和消费,数据还是在磁盘中,主要是利用了磁盘的顺序读写速度超过内存随机读写速度的特性;kafaka的数据会复制到几台机器上,当一台机器失效,生产和消费者可以切换使用其他机器。例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-24 13:49:23 248

原创 力扣数据库

力扣sql总结

2023-04-11 15:47:16 916

原创 Elastic Stack从入门到实践

elastc stack从入门到实践

2023-04-07 18:02:37 2293

原创 大数据之路系列之Flink高级进阶(13)

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-03-24 18:09:00 320

原创 大数据之路系列之flink(12)

flink教程

2023-03-22 18:17:24 158

原创 ClickHouse原理解析与应用实践

ClickHouse原理解析与应用实践

2023-03-13 18:36:58 979

原创 大数据之路系列之SPARK_SQL(10)

spark-sql,spark-hive,sparkSql集成hive

2023-02-28 11:16:28 466

原创 大数据之路系列之SPARK2-spark提升(09)

spark优化

2023-02-22 14:41:07 191

原创 大数据之路系列之SPARK(08)

Spark快速入门

2023-02-20 18:16:21 143

原创 Spark+ES+ClickHouse 构建DMP用户画像(2)

Spark+ES+ClickHouse 构建DMP用户画像

2023-02-14 18:14:06 632

原创 Spark+ES+ClickHouse 构建DMP用户画像(1)

Spark+ES+ClickHouse 构建DMP用户画像(1)--环境搭建

2023-02-09 16:07:58 745

原创 大数据之路系列之HBASE2(07)

深入HBASE架构原理

2023-01-11 18:12:00 234

原创 大数据之路系列之HBASE(06)

hbase

2023-01-09 18:05:00 294

原创 大数据之路系列之hive(05)

hive

2022-12-29 18:02:21 179

原创 大数据之路系列之Hadoop(04)

MapReduce、yarn核心梳理

2022-12-20 19:46:23 150

原创 大数据之路系列之Hadoop(03)

hadoop核心理论

2022-12-08 18:12:40 159

原创 大数据之路系列之shell脚本(02)

shell脚本的使用

2022-12-02 18:00:11 1169

原创 大数据之路系列之Linux命令(01)

大数据之路--Linux基础命令

2022-12-02 16:36:08 1619

原创 数据治理从理论到实战系列(三)——cdh安装

cdh安装配置

2022-10-26 17:05:23 758

原创 数据治理从理论到实战系列(二)——Linux虚拟机配置

vwware安装、Linux虚拟机安装、关闭防火墙、Linux克隆

2022-10-21 17:59:26 364

原创 数据治理从理论到实战系列(一)——简要概述

数据治理是对数据资产的规划、管理和监控,最终保证数据的可用性、数据质量、数据安全。

2022-10-17 15:18:22 900 1

atlas编译后文件,开封即用

依赖版本 zookeeper 3.4.9 hadoop 3.2.0 hive 3.1.2 hbase 2.2.7 kafka 2.8.2 solr 5.2.1

2022-10-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除