Zebrawen-优快云博客

原创 with结构语法使用踩坑，总结了下CTE语法使用的优缺点和使用场景！

with语法（CTE语法）使用的优缺点和使用场景

2025-03-09 23:13:31 242

原创 Kafka事务实战：这些场景必须动手写Java代码？从原子操作到祖传系统对接

这种时候现成的 Connector 肯定没有，只能自己用 Java 写个客户端，解析二进制协议再往 Kafka 里丢数据。这时候就得用 Java 代码 **显式开启 Kafka 事务**，把这两个操作绑在一起，确保要么都成，要么都回滚。- **买精装房**：直接用 Kafka Connect/Flink SQL，省事但没法改结构。- **自己敲代码**：相当于毛坯房自己设计，能搞智能家居、隐藏式灯光，但累秃头。比如用户注册后发欢迎邮件，用现成的消息队列模板配置就行，不需要自己造轮子。

2025-03-09 18:34:09 229

原创 kafka的消费者组的必要性

在解决生产中的数据一致性和顺序性问题中消费者组的必要性和设置方法

2025-02-20 05:17:19 599

原创大数据上云迁移解决方案

云迁移方法论/重点

2024-07-16 14:34:49 369

原创 Lambda架构升级Kappa架构

系统架构更加简洁，很多实时需求更多的场景kappa可能是未来数据仓库的一个趋势

2024-05-23 15:48:03 496 2

原创大数据离线和实时是什么？

离线处理和实时处理的含义

2024-05-23 10:33:12 1415

原创最常用的HQL的参数优化问题

-设置Hive的执行引擎。推荐使用tez或spark来代替默认的mr（MapReduce），因为它们可以提供更好的性能。set: 推荐使用ORC或Parquet--设置是否压缩Hive写入的数据。将此设置为true可以节省存储空间并减少写入时间。set:true;--设置MapReduce作业的输出是否压缩。set--设置为true以启用查询的向量化执行，可以显著提高性能。set和--设置为true以启用表达式求值的缓存，可以减少重复计算。set--设置为true以启用查询执行的并行处理。set。

2024-04-04 07:26:55 762 1

原创 Flink的RocksDB的使用以及问题

在各个节点的磁盘上的，处理数据的时候，Flink 框架负责保证数据项与其对应键的状态之间的一致性匹配。但是当我们（non-key）属性进行数据关联，比如日期，而不是原始键（如 ID），这时就不能直接依赖 Flink 的 keyBy 分区机制来直接访问状态了，因为 keyBy 机制确保的是相同键的数据项会被路由到相同的并行实例。**：因为涉及磁盘IO，SSD是必要的，而且会有缓存，合并和压缩的时候也会对cpu有一定依赖。合并读取和压缩策略：通过智能的读取和压缩策略减少磁盘访问次数和优化存储空间使用。

2024-04-04 07:05:04 576 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Zebrawen的博客

原创 with结构语法使用踩坑，总结了下CTE语法使用的优缺点和使用场景！

原创 Kafka事务实战：这些场景必须动手写Java代码？从原子操作到祖传系统对接

原创 kafka的消费者组的必要性

原创大数据上云迁移解决方案

原创 Lambda架构升级Kappa架构

原创大数据离线和实时是什么？

原创最常用的HQL的参数优化问题

原创 Flink的RocksDB的使用以及问题

原创 Flink的状态编程和容错机制概念区分

原创 flink跨窗口不能join数据的解决方案

原创交换分区的作用和实践

原创 starrocks读hive表无数据

大数据-常用组件原理-大数据培训

空空如也