- 博客(1055)
- 资源 (10)
- 收藏
- 关注
原创 【Git】-- Rebase 减少 Commit 次数指南
Git Rebase 减少 Commit 次数指南摘要 本指南介绍了三种整理 Git Commit 历史的方法:1)交互式 Rebase(推荐),可灵活选择合并特定 Commit;2)软重置合并,简单快速但灵活性低;3)Fixup+Autosquash,适合开发时标记需合并的 Commit。最佳实践包括:提交前整理本地历史、保持 Commit 原子性、遵循 Commit 消息规范。注意事项:仅对未推送 Commit 使用 Rebase,团队协作前先沟通,重要操作前创建备份分支。指南还提供了冲突解决方案和常见
2025-11-06 11:12:17
654
原创 【StarRocks】-- 4.x 与 3.x 版本对比分析
StarRocks 4.x相比3.x版本实现了全面升级,在数据湖分析、安全认证、存储优化和查询性能等方面均有显著改进。4.x版本新增了统一缓存机制、多表事务支持、企业级安全特性等功能,数据湖查询性能提升80%以上,TPC-DS查询性能提升20%,并支持高精度DECIMAL256数据类型。其中,3.4-3.5版本已引入Iceberg V2优化、TimeTravel等18项功能,4.x版本则进一步新增了27项核心特性。建议需要数据湖分析、高精度计算或企业级安全的用户升级至4.x版本。
2025-10-31 18:31:33
151
原创 【架构】-- OpenFeign:声明式 HTTP 客户端框架深度解析
OpenFeign是一个声明式HTTP客户端框架,通过在Java接口中使用注解来定义HTTP请求,大幅简化了微服务间通信的开发工作。其核心特性包括声明式编程、丰富的注解支持、拦截器机制、编解码器自定义、完善的错误处理及详细的请求/响应日志记录。OpenFeign与Spring Cloud深度集成,支持服务发现、负载均衡、断路器等功能,同时提供连接池配置、请求压缩等性能优化方案。开发者可以快速上手并通过自定义编解码器、超时处理等进阶功能满足复杂业务需求,是现代化微服务架构中的理想HTTP客户端选择。
2025-10-29 10:44:06
983
原创 【架构】-- Nightingale:云原生监控告警平台的深度解析
Nightingale是一款专注于告警管理的开源云原生监控平台,由滴滴团队开发并捐赠给中国计算机学会。核心特性包括多数据源支持(Prometheus、ElasticSearch等)、专业告警管理(降噪、升级、自愈)、业务分组与权限管理。采用Go语言开发,支持Docker快速部署,特别适合企业级监控和边缘计算场景。与Grafana相比,更强调告警能力而非可视化。项目在GitHub上获得12.5k+星标,持续更新中,是云原生监控领域的专业解决方案。
2025-10-24 18:35:54
714
原创 【架构】-- bytebase 项目分析
摘要: Bytebase是一款开源的数据库DevSecOps平台,整合了数据库CI/CD、安全合规与团队协作功能,支持PostgreSQL、MySQL等主流数据库。其核心优势包括GitOps集成、自动化迁移、SQL审查、数据脱敏及RBAC权限管理,适用于开发团队、DBA和安全团队。通过统一管理界面和API支持,Bytebase解决了传统工具分散、低效的问题,被CNCF收录为云原生关键项目。部署灵活(Docker/Kubernetes),社区活跃(GitHub 13k+ Stars),是企业实现数据库现代化管
2025-10-24 18:28:38
1176
原创 【Kubernetes】-- 网络的新兴解决方案
《KubeDoor:Kubernetes网络新方案深度解析》摘要 KubeDoor是CassInfra团队开发的Kubernetes CNI插件,针对传统网络方案的性能瓶颈和配置复杂性提供创新解决方案。项目采用overlay网络架构,包含数据平面智能路由和控制平面网络控制器两大核心组件,具备Pod网络隔离、服务发现、多云支持等特性。技术优势体现在三方面:性能上通过零拷贝和DPDK实现低延迟高吞吐;易用性提供声明式配置和自动化运维;生态兼容Kubernetes标准及主流云平台。典型应用场景覆盖微服务架构、边缘
2025-10-23 17:11:35
522
原创 【架构】-- Apache Beam 项目介绍
Apache Beam是一个统一的批流处理编程模型,支持Java、Python等多种语言,允许开发者编写一套代码适配多种执行引擎(如Flink、Spark等)。其核心优势在于批流一体的统一API、跨引擎可移植性以及对事件时间语义的完善支持。Beam采用PCollection、PTransform等抽象概念构建数据处理流程,提供丰富的窗口、触发器机制,并拥有广泛的IO连接器生态。典型应用场景包括实时日志分析、物联网数据处理、ETL批处理等。虽然不同执行引擎对高级特性的支持存在差异,但Beam通过解耦业务逻辑与
2025-10-21 10:25:41
385
原创 【StarRocks】-- DATETIME 与 TIMESTAMP 区别详解
本文详细解析了StarRocks中DATETIME/DATETIMEV2与TIMESTAMP的区别及使用场景。DATETIME系列存储人类可读时间,不携带时区;TIMESTAMP实际指Unix时间戳,建议用BIGINT存储。关键差异包括:精度选择(DATETIMEV2支持微秒级)、时区处理(仅函数计算时影响)、存储方式等。针对不同场景提供选型建议:单时区展示用DATETIMEV2,跨时区计算用BIGINT存储Epoch。特别强调与MySQL迁移时的注意事项,并给出常见问题解决方案和最佳实践清单,包括统一入口
2025-10-13 10:33:11
146
原创 【StarRocks】-- StarRocks 窗口函数:ROW_NUMBER 全面指南(基于 3.5)
《StarRocks ROW_NUMBER窗口函数指南》全面解析了该核心功能在3.5版本中的应用。文章系统介绍了ROW_NUMBER的定义(为分区内行生成唯一序号)、基础语法(PARTITION BY分组,ORDER BY排序)及与RANK等函数的区别。重点展示四大实战场景:学科Top-N排名、用户行为去重、分页稳定编号、边界记录提取,并给出QUALIFY高效写法。针对性能优化,强调排序列唯一性、合理分区等最佳实践,同时警示NULL值处理和排序稳定性的常见陷阱。作为窗口函数基石,ROW_NUMBER配合分区
2025-09-29 09:58:46
142
原创 【StarRocks】-- 深入理解 StarRocks 窗口函数 LAG()
StarRocks窗口函数LAG()用于获取当前行之前的第N行数据,适用于时间序列分析。其语法为LAG(expr[,offset[,default]]) OVER(PARTITION BY...ORDER BY...),支持设置偏移量、默认值和可选IGNORENULLS参数。典型应用包括:1)计算环比变化;2)状态变更检测;3)缺失值填充。使用时需注意:必须指定ORDER BY保证顺序稳定性,避免在WHERE中直接使用LAG(),合理设置分区键优化性能。该函数常与LEAD()配合使用,实现更复杂的时间序列分
2025-09-29 09:26:11
104
原创 【StarRocks】-- 异步物化视图实战
StarRocks异步物化视图(AsyncMV)实战指南摘要 本文深度解析StarRocks异步物化视图的核心概念与应用实践。AsyncMV通过预计算实现查询加速,支持多表Join、外部Catalog(Hive/Iceberg等)和复杂聚合场景。关键特性包括: 异步刷新机制:支持手动/定时刷新,增量与全量更新策略 智能查询改写:优化器自动匹配业务SQL实现透明加速 分层架构设计:适用于数仓分层、数据湖加速等典型场景 最佳实践建议:优先为高频重查询创建MV,采用时间分区优化性能,合理设置刷新策略与资源配额,并
2025-09-20 21:44:55
273
原创 【StarRocks】-- 同步物化视图实战指南
StarRocks同步物化视图实战指南摘要:本文详细介绍了StarRocks同步物化视图(Rollup)的原理与应用。同步MV作为单表查询加速的"特殊索引",支持实时自动刷新和查询重写,适合高频聚合场景。文章包含快速上手指南、核心语法清单及最佳实践(如精确/近似去重方案),并提供了常见避坑清单和故障排查方法。与异步MV相比,同步MV维护成本低、延迟小,但仅支持单表和有限聚合函数。建议根据业务场景合理选择,并定期梳理优化Rollup配置,以在不改动SQL的情况下实现查询透明加速。
2025-09-20 21:36:22
229
原创 【Kubernetes】-- Gonzo 之 Go 基于 TUI 的日志分析工具
Gonzo是一款基于Go语言的TUI日志分析工具,支持本地文件、云日志服务和OpenTelemetry等多种日志源。具有实时分析、交互式仪表盘、AI增强洞察(兼容OpenAI/Ollama等模型)等特性,提供11+主题皮肤和K9s集成。安装方式包括Go安装、Homebrew或直接下载二进制文件,支持Shell补全和环境变量配置。项目采用MIT许可证,架构清晰,包含日志分析引擎、AI接入等模块,适合开发运维人员在终端高效处理日志。
2025-09-19 22:00:06
1058
原创 【Java】-- rjvm 项目分析
用 Rust 编写的迷你 Java 虚拟机(以学习/教学为主): 以 Java 7 为主(以仓库 README 为准)
2025-09-18 18:37:11
992
原创 【StarRocks】-- 索引选择
StarRocks索引设计指南:Bitmap索引适合中等基数(1万-10万)列的等值/范围查询,不支持浮点、布尔及高精度类型,低基数列可自动优化;BloomFilter索引适合高基数(10万+)且低重复列的IN/等值查询,不支持小整数和浮点类型。明细/主键模型支持全列索引,聚合/更新模型仅限Key列。设计时应结合查询场景,优先将高频查询列和高效类型(如整型、DATE)放在前面以利用前缀索引优势。
2025-09-17 18:01:20
86
原创 【SQL】-- sql having 和 where 的 区别
摘要:WHERE和HAVING都是数据筛选条件,但适用场景不同。WHERE在GROUP BY之前执行,用于筛选单行记录;HAVING在GROUP BY之后执行,用于筛选聚合后的分组结果。WHERE针对行数据(如筛选年龄>30的员工),HAVING针对分组结果(如筛选人数>5的部门)。两者的主要区别在于应用时机和作用对象。
2025-09-12 12:01:11
91
原创 【运维】-- 前端会话回放与产品分析平台之 openreplay
OpenReplay是一款开源自托管的前端会话回放与分析平台,核心功能包括用户行为回放、技术上下文采集(网络请求、JS错误等)和实时协作。采用Monorepo结构,主要技术栈为TypeScript(49%)和Python(18%)。支持多种部署方式,具有丰富的插件生态和隐私保护功能,适用于复杂前端应用的故障排查和用户行为分析。优势在于数据主权可控、采集效率高,但需注意自托管成本和隐私策略配置。建议先小范围试点,逐步集成现有监控系统并制定数据管理策略。
2025-09-12 10:27:51
1143
原创 【 运维相关】-- HTTP 压测/负载发生器之新秀 oha
oha是一款基于Rust开发的轻量级HTTP压力测试工具,具有跨平台、低开销的特点。它支持高并发连接、多种测试模式(固定持续时间/请求数)、RPS限速发压等功能,提供终端可视化输出和JSON格式结果。工具可通过多种方式安装,支持GET/POST等HTTP方法,可自定义请求头和请求体,并允许跳过TLS校验。与wrk、hey等工具相比,oha在限速发压、TUI展示和现代协议支持方面更具优势。最佳实践建议采用持续时间模式,合理设置并发与RPS,注意预热和稳定期,并保存JSON结果用于性能回归对比。适用于本地快速压
2025-09-10 12:12:24
825
原创 【Apache Paimon】-- 1.2.0 版本的Table 类型和 merge engine
摘要:Paimon表分为主键表和非主键表(AppendOnly表)两种类型。主键表支持四种合并机制(Merge Engine):deduplicate(默认去重保留最新)、first-row(保留第一条)、aggregation(聚合计算)和partial-update(增量更新)。非主键表适合日志等无需更新的场景,通过设置bucket=-1可创建高性能的AppendScalable表。不同合并机制适用于不同业务场景,如deduplicate保证数据唯一性,partial-update支持字段级更新。主键表
2025-07-18 10:19:21
373
原创 【Starrocks 异常解决】-- [routine load] error when primary key size exceed the limit
摘要:创建StarRocks主键表时遇到"primary key size exceed the limit"错误,原因是主键默认最大长度为128字节。解决方案包括:1)检查表结构,确保主键列符合要求(数值/字符串/日期类型);2)修改BE节点配置文件be.conf,调整primary_key_limit_size参数值。注意主键需包含分区和分桶列,创建后不可修改且值不能更新。通过调整参数限制可解决主键长度超限问题。(139字)
2025-07-10 09:18:16
232
原创 【Starrocks 异常解决】-- mysql flink sync to starrocks row error
摘要:日志显示Flink 1.20与StarRocks 3.3.0集成时出现列数不匹配错误,目标列数35与源数据列数28/1不符。错误原因是默认CSV格式使用\t分隔符导致解析异常。解决方案是在Flink StarRocks Sink配置中添加参数'sink.properties.strip_outer_array'='true'和'sink.properties.format'='json',切换为JSON格式后问题解决。该问题涉及多个巴基斯坦银行数据导入时的格式处理异常。
2025-07-07 15:13:10
311
原创 11-StarRocks故障诊断FAQ
本文档涵盖了StarRocks故障诊断过程中的常见问题和解决方案。在实际故障处理过程中,建议建立完善的故障处理流程,积累故障处理经验,持续改进故障处理能力。如果遇到其他问题,可以参考官方文档或向社区寻求帮助。
2025-06-24 15:08:11
262
原创 10-StarRocks监控告警FAQ
StarRocks监控告警FAQ摘要 本文档提供了StarRocks监控告警系统的配置指南和常见问题解决方案。主要内容包括: 监控指标配置:详细介绍了系统指标、集群指标和查询指标的监控方法,包括SQL命令示例和关键指标设置。 性能监控:涵盖查询性能、资源使用和并发指标的监控配置,包括慢查询阈值设置和资源使用分析。 业务监控:提供数据指标、导入导出状态和错误监控的具体实现方案。 告警系统配置:包括Prometheus监控设置、关键指标定义以及基础告警规则和性能告警规则的编写示例。 文档通过具体SQL命令和YA
2025-06-24 15:03:03
488
原创 09-StarRocks安全配置FAQ
StarRocks安全配置FAQ摘要 本文提供了StarRocks数据库的安全配置常见问题解答,主要涵盖三大核心安全领域: 用户认证管理 详细说明了创建用户、修改密码和删除用户的操作方法 提供了密码复杂度、过期策略和历史记录等安全策略配置指南 包含LDAP认证的完整配置流程,从服务器设置到用户创建 权限控制系统 介绍了基本权限(SELECT/INSERT等)和高级权限(CREATE/DROP等)的分配方法 讲解了角色权限的创建、分配和管理操作 展示了表级、列级和分区级细粒度权限的控制方式 网络安全防护 提供
2025-06-24 15:01:14
220
原创 08-StarRocks性能调优FAQ
StarRocks性能调优摘要 本文提供了StarRocks数据库性能调优的常见问题解答,涵盖查询优化、索引设计、分区策略和系统配置等关键方面。主要内容包括:查询优化技巧(使用EXPLAIN分析、避免全表扫描、优化JOIN和聚合查询);索引选择与维护建议(高频查询列索引、复合索引);分区策略设计(时间分区、范围分区)及其管理方法;以及系统内存配置优化(JVM参数调整、查询内存限制设置)。这些优化措施可显著提升StarRocks的查询性能和系统效率。
2025-06-24 15:00:34
331
原创 07-StarRocks版本升级FAQ
StarRocks版本升级常见问题解答 本文档整理了StarRocks数据库版本升级的常见问题及解决方案。主要内容包括: 升级准备工作:环境检查、数据备份和兼容性验证方法 升级流程指南:详细说明滚动升级和停机升级的具体步骤 回滚方案:提供快速回滚脚本和自动化回滚触发机制 兼容性检查:版本矩阵比对、功能兼容性验证和配置参数检查 文档提供了具体的SQL命令和Shell脚本示例,帮助用户安全完成版本升级,确保业务连续性。升级前需充分准备、验证兼容性,升级后要严格验证功能和性能。
2025-06-24 14:59:51
184
原创 06-StarRocks常见错误FAQ
StarRocks功能使用FAQ摘要 本文档总结了StarRocks数据库使用中的常见问题及解决方案,涵盖四大核心功能: 表管理:包括表的创建、修改和删除方法,重点介绍了分区表管理和分桶策略选择(Hash/Random),提供了分桶数量选择的参考标准。 索引管理:详细说明普通/唯一/复合索引的创建和使用方法,以及索引性能优化技巧,如覆盖索引和查询优化建议。 物化视图:介绍基本和分区物化视图的创建方法,提供刷新策略(手动/异步)和性能监控的最佳实践。 外部表:展示HDFS和S3外部表的创建配置,包括必要的连接
2025-06-24 14:57:21
348
原创 05-StarRocks功能使用FAQ
StarRocks功能使用FAQ摘要 本文档总结了StarRocks数据库使用中的常见问题及解决方案,涵盖四大核心功能: 表管理:包括表的创建、修改和删除方法,重点介绍了分区表管理和分桶策略选择(Hash/Random),提供了分桶数量选择的参考标准。 索引管理:详细说明普通/唯一/复合索引的创建和使用方法,以及索引性能优化技巧,如覆盖索引和查询优化建议。 物化视图:介绍基本和分区物化视图的创建方法,提供刷新策略(手动/异步)和性能监控的最佳实践。 外部表:展示HDFS和S3外部表的创建配置,包括必要的连接
2025-06-24 14:56:33
183
原创 04-StarRocks集群运维FAQ
StarRocks集群运维指南摘要 本文档提供了StarRocks数据库集群运维的全面指导,包含四大核心模块: 集群管理:包括查看集群状态(FRONTENDS/BACKENDS/BROKER节点)、添加/删除节点、配置管理等基础操作指南 节点维护:详细说明节点重启流程(FE/BE节点)、集群升级步骤和节点故障处理方案 监控告警:介绍Prometheus监控配置、关键指标采集方法及告警规则设置,涵盖CPU/内存/磁盘等核心指标 故障处理:提供脑裂检测等常见问题的诊断与解决方案 文档采用问答形式,每个问题包含多
2025-06-24 14:55:44
218
原创 03-StarRocks查询优化FAQ
StarRocks查询优化指南摘要 本文档总结了StarRocks数据库查询优化的关键要点,涵盖SQL优化、索引使用和分区策略三大核心领域。SQL优化方面,重点介绍了查询计划分析、JOIN优化、聚合查询和子查询的最佳实践。索引优化部分详细说明了主键、唯一和普通索引的选择策略,以及索引维护技巧。分区策略章节则阐述了时间、范围和列表分区的设计方法,以及分区查询优化和管理建议。通过实施这些优化技术,用户可显著提升StarRocks数据库的查询性能。
2025-06-24 14:55:07
341
原创 02-StarRocks数据导入导出FAQ
本文档涵盖了StarRocks数据导入导出过程中的常见问题和解决方案。在实际使用过程中,建议根据具体的数据量和业务需求选择合适的导入导出方式,并进行相应的性能优化。如果遇到其他问题,可以参考官方文档或向社区寻求帮助。
2025-06-24 14:54:27
564
原创 01-StarRocks安装部署FAQ
本文档涵盖了StarRocks安装部署过程中的常见问题和解决方案。在实际部署过程中,建议根据具体的硬件环境和业务需求进行相应的配置调整。如果遇到其他问题,可以参考官方文档或向社区寻求帮助。
2025-06-24 14:53:34
295
原创 【Spark】-- DAG 和宽窄依赖的核心
DAG,全称 Directed Acyclic Graph(有向无环图),在 Spark 中用于表示 RDD(弹性分布式数据集)之间的依赖关系。每个节点代表一个 RDD,边表示 RDD 之间的转换操作。Spark 通过构建 DAG 来规划任务的执行路径,从而实现高效的任务调度和容错机制。DAG 和宽窄依赖是 Spark 的核心概念,直接影响任务的执行效率和性能优化策略。通过理解和合理利用这两个概念,可以有效地优化 Spark 程序的执行性能。
2025-05-16 09:30:16
436
原创 【架构】-- StarRocks 和 Doris 介绍与选型建议
查询性能 | ✅ 高性能,支持向量化执行和 CBO 优化器 | ✅ 高性能,优化的查询引擎 |- **实时性要求高**:如果业务对数据的实时性要求较高,建议选择 **StarRocks**,其在实时数据处理和低延迟查询方面表现优越。- **复杂查询需求**:对于需要处理复杂多表关联查询的场景,两者均可胜任,需根据具体性能测试结果进行选择。
2025-04-21 16:50:54
1243
原创 【DeepSeek】-- 常用润色指令
指令:请在不改变原文意思的基础上,对以下文章进行扩写。要求如下:1.围绕文章主题,供更丰富的信息和观点。2.引人相关案例或数据支持文中论点,增强说服力。3.结构清晰、逻辑连贯,易于读者理解。
2025-04-17 11:04:35
1701
原创 【生活】-- 微信小程序和传统APP的优缺点对比
小程序 ✅ 无需下载安装:即用即走,节省手机存储空间。 ✅ 跨平台兼容:iOS和Android均可使用,无需单独适配。 ❌ 功能受限:受限于微信框架,无法实现复杂功能(如大型游戏、高性能计算)。 ❌ 用户留存低:次日留存约13%,双周留存仅1%。APP ✅ 功能强大:可开发复杂应用(如视频编辑、3D游戏)。 ✅ 个性化体验:UI设计更灵活,交互更流畅。 ❌ 安装门槛高:需下载,占用存储空间,用户可能因流量或存储问题放弃。小程序 ✅ 开发成本低:周期短(约2周),适合初创团队。 ✅ 云开发支
2025-04-16 11:01:17
922
原创 【Apache Paimon】-- flink job 并行度个数决定 bucket 个数
如果不需要对 Paimon表进行即席(OLAP)查询,只需进行批式或流式消费,可以选择配置以下表参数,将数据文件格式改为avro,并关闭采集统计数据,以进一步提高写入作业的效率。,允许至多3个检查点同时进行,主要用于减小部分并发检查点长尾的影响。1、适当减小 sink.parallelism。3、将小文件合并改为完全异步。
2025-04-10 11:05:25
269
原创 【Java 基础】-- 深入剖析 Java HashMap 中的红黑树
节点颜色:每个节点要么是红色,要么是黑色。根节点:根节点是黑色。叶子节点:每个叶子节点(NIL)是黑色。红色节点限制:每个红色节点的两个子节点一定都是黑色。黑色节点平衡:从任一节点到其每个叶子节点的路径都包含数量相同的黑色节点。这些特性确保了红黑树的平衡性,使其在最坏情况下的查找、插入和删除操作的时间复杂度维持在 O(log n)。
2025-03-14 16:45:10
578
16-Flink与Kubernetes Operator集成实践与经验
2024-11-15
15-Flink from YARN to Kubernetes: 资源优化和容器化实践
2024-11-15
14-Flink Kubernetes Operator 从1.4.0 升级到1.6.0的技术手册
2024-11-15
13-Flink Kubernetes Operator 高级特性详解 - 自动伸缩与高可用机制
2024-11-15
12-Flink Kubernetes Operator部署与管理Flink应用实践
2024-11-15
11-Flink kubernetes operator 常用的命令
2024-11-15
10-Flink Kubernetes Operator 在本地环境的详细安装与操作指导
2024-11-15
9-Flink Kubernetes Operator 架构设计与实现详解
2024-11-15
8-在本地运行第一个 flink wordcount job
2024-11-15
7-Flink的核心特性-new
2024-11-15
5-在 Kubernetes 上运行容器
2024-11-15
Canal开源产品介绍
2018-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
4