自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_44090239的博客

原创 01_kmeans/DBSCAN/层次算法概述

例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2024-08-14 16:21:37 352 1

原创 flink+clickhouse玩转企业级实时大数据开发（1）

离线数据：batch 有界静态的数据集。实时/流数据：连续无界动态的数据集。

2023-05-11 17:59:01 3643

原创大数据之路系列之FinkSql（14）

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-27 17:29:35 475

原创 Elastic Stack从入门到实践（2）

例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-24 15:31:18 282

原创大数据之路系列之kafka（11）

简称MQ，消息加队列，就是保存消息的队列，术语消息传输过程中的容器是分布式帆布订阅消息系统，每秒百万消息的生产和消费，数据还是在磁盘中，主要是利用了磁盘的顺序读写速度超过内存随机读写速度的特性；kafaka的数据会复制到几台机器上，当一台机器失效，生产和消费者可以切换使用其他机器。例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-04-24 13:49:23 285

原创力扣数据库

力扣sql总结

2023-04-11 15:47:16 1067

原创 Elastic Stack从入门到实践

elastc stack从入门到实践

2023-04-07 18:02:37 2573

原创大数据之路系列之Flink高级进阶（13）

例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

2023-03-24 18:09:00 392

原创大数据之路系列之flink(12)

flink教程

2023-03-22 18:17:24 273

原创 ClickHouse原理解析与应用实践

ClickHouse原理解析与应用实践

2023-03-13 18:36:58 1128

原创大数据之路系列之SPARK_SQL（10）

spark-sql,spark-hive,sparkSql集成hive

2023-02-28 11:16:28 517

原创大数据之路系列之SPARK2-spark提升（09）

spark优化

2023-02-22 14:41:07 284

原创大数据之路系列之SPARK（08）

Spark快速入门

2023-02-20 18:16:21 202

原创 Spark+ES+ClickHouse 构建DMP用户画像(2)

Spark+ES+ClickHouse 构建DMP用户画像

2023-02-14 18:14:06 697

原创 Spark+ES+ClickHouse 构建DMP用户画像(1)

Spark+ES+ClickHouse 构建DMP用户画像(1)--环境搭建

2023-02-09 16:07:58 838

原创大数据之路系列之HBASE2（07）

深入HBASE架构原理

2023-01-11 18:12:00 276

原创大数据之路系列之HBASE（06）

hbase

2023-01-09 18:05:00 355

原创大数据之路系列之hive（05）

hive

2022-12-29 18:02:21 233

原创大数据之路系列之Hadoop（04）

MapReduce、yarn核心梳理

2022-12-20 19:46:23 212

原创大数据之路系列之Hadoop（03）

hadoop核心理论

2022-12-08 18:12:40 193

原创大数据之路系列之shell脚本（02）

shell脚本的使用

2022-12-02 18:00:11 1223

原创大数据之路系列之Linux命令（01）

大数据之路--Linux基础命令

2022-12-02 16:36:08 1755

原创数据治理从理论到实战系列(三)——cdh安装

cdh安装配置

2022-10-26 17:05:23 849

原创数据治理从理论到实战系列(二)——Linux虚拟机配置

vwware安装、Linux虚拟机安装、关闭防火墙、Linux克隆

2022-10-21 17:59:26 432

原创数据治理从理论到实战系列(一)——简要概述

数据治理是对数据资产的规划、管理和监控，最终保证数据的可用性、数据质量、数据安全。

2022-10-17 15:18:22 958 1

atlas编译后文件，开封即用

依赖版本 zookeeper 3.4.9 hadoop 3.2.0 hive 3.1.2 hbase 2.2.7 kafka 2.8.2 solr 5.2.1

2022-10-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除