- 博客(298)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 Doris:打破 SQL 方言壁垒,构建统一数据查询生态
在大数据领域,不同的数据库系统往往使用不同的 SQL 方言。这就好比不同地区的人说着不同的语言,给数据分析师和开发人员带来极大的困扰。当企业需要整合多个数据源进行分析时,可能要花费大量时间和精力,在不同的 SQL 语法之间切换。然而,Apache Doris 凭借强大的 SQL 方言兼容能力,打破了这一壁垒,为用户构建了一个统一的数据查询生态。
2025-04-02 20:55:52
694
原创 Apache Doris 数据导入方案终极指南:原理、优化与问题排查
本文将彻底拆解 Stream Load、Broker Load、Routine Load、Insert into 四大核心方案,从原理解析到导入调优,从数据转换到故障排查,提供一站式解决方案。
2025-03-26 07:53:12
711
原创 存算分离是否真的有必要?从架构之争到 Doris 实战解析
在数据库与大数据领域,“存算一体” 与 “存算分离” 的架构之争从未停歇。有人质疑:“存算分离真的有必要吗?本地盘性能难道不够?” 答案并非非黑即白 —— **技术选型的关键,在于业务场景与资源诉求的精准匹配**。
2025-03-21 20:30:00
1108
原创 Apache Doris 湖仓一体:打破数据边界,解锁实时分析的终极答案
湖仓一体架构融合数据仓库的高性能、强管理能力和数据湖的灵活性,底层支持多种数据类型并存与共享,上层通过统一接口,同时满足实时查询和分析,极大便利企业数据治理,成为大数据领域的发展新趋势。
2025-03-19 22:45:00
650
原创 Doris vs Elasticsearch:全维度对比与实际成本案例解析
本文将从架构设计、数据导入、查询优化、存储管理、使用方式、运维难度、社区活跃度等多个角度进行对比,并重点加入使用成本的讨论,最后通过中信银行信用卡中心的实际案例,展示 Doris 替换 Elasticsearch 后的显著收益。
2025-03-14 20:00:00
1136
原创 Doris 数据划分:分区与分桶策略全解析
在 Doris 的分布式架构里,数据划分策略是实现高效存储和查询的关键所在。它主要依靠分区(Partition)和分桶(Bucket)这两层逻辑划分,对数据的分布进行精细化管理。
2025-03-13 20:30:00
629
原创 Doris vs ClickHouse 企业级实时分析引擎怎么选?
本文将详细介绍 Doris 的优势,并通过直观对比展示两者的关键差异,同时分享一个企业成功用 Doris 替换 ClickHouse 的实践案例,帮助您做出明智的技术决策。
2025-03-07 22:16:30
938
原创 Apache Doris 索引的全面剖析与使用指南
搞大数据开发的都知道,想要在海量数据里快速查数据,就像在星图里找一颗特定的星星,贼费劲。不过别慌,数据库索引就是咱们的 “定位神器”,能让查询效率直接起飞!就拿 Apache Doris 这个超火的分析型数据库来说,它支持好几种索引,每种都有自己的 “独门绝技”,能在不同查询场景下大显身手。今天就带大家好好研究下 Apache Doris 的索引,看看它到底是怎么做到这么牛的!
2025-02-25 20:30:00
864
原创 Doris 查询优化秘籍(下篇):进阶优化技巧全解析
在上篇秘籍中,我们深入挖掘了 Doris 查询优化里 Schema 设计、索引优化以及分区裁剪优化扫表的关键策略,这些策略就像给 Doris 这位 “数据大侠” 配上了神兵利器,战斗力直线飙升。今天,咱们接着探索下篇,看看还有哪些进阶技巧,能让 Doris 在数据处理的战场上大杀四方,一路 “狂飙”。
2025-02-21 19:45:22
1034
原创 Doris 查询优化秘籍(上篇):关键优化策略剖析
在大数据开发的领域中,Apache Doris 凭借其强大的性能,成为处理海量数据的有力工具。若想让 Doris 在数据处理中发挥出最大效能,查询优化必不可少。本文作为 Doris 查询优化秘籍的上篇,将深入剖析 Schema、索引优化以及使用分区裁剪优化扫表的关键策略。
2025-02-17 21:07:50
1119
原创 Doris 磁盘问题全解析:从挂盘到 Trash 机制,一文读懂!
在使用 Apache Doris 时,磁盘相关的问题时有发生。今天,我们就来系统地梳理一下常见的 Doris 磁盘问题,以及对应的解决方案,帮助大家快速定位并处理问题!
2025-02-11 07:00:00
831
原创 Doris 查询正确性问题排查指南
在使用 Apache Doris 的过程中,Unique Key 的正确性问题可能会对数据查询结果和存储一致性产生影响。本文将为大家详细解析这些问题的分类、排查步骤以及解决方案。希望通过这篇文章,让大家对 Unique Key 的正确性排查有一个清晰的认识。
2025-01-24 08:20:37
1129
原创 Doris 建表与分区问题全解析
在使用 Doris 进行表创建和分区操作时,用户可能会遇到各种错误情况。本文旨在深入剖析常见的创建表失败以及动态分区失败问题,并提供具有针对性的解决思路。
2025-01-23 14:23:01
414
原创 Doris 导入慢该如何排查及优化?
在使用 Apache Doris 进行数据导入时,经常会遇到导入性能不理想的情况。今天我们就来深入分析这些问题的原因及其解决方案!
2025-01-14 08:11:39
1228
原创 【Apache Doris】周FAQ集锦:第 29 期
在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。
2025-01-13 14:27:17
907
原创 Routine Load 导入问题处理指南
在使用 Apache Doris 的 Routine Load 时,你是否曾经被各种奇奇怪怪的问题卡住?今天就来分享一些最常见的 Routine Load 问题,并提供相应的解决方案,让你快速应对,高效解决!
2025-01-10 22:23:11
1245
2
原创 Doris的Stream Load那些事儿,你踩过哪些“坑”?
“Stream Load”作为Apache Doris中一款快速导入数据的利器,虽然方便,但也让不少人“踩坑”。今天,我们就来聊聊有那些坑,以及如何优雅地避开它们。
2025-01-07 11:03:57
657
原创 如何排查 Apache Doris 中 “Failed to commit txn“ 导入失败问题?
今天来聊聊 Doris 数据导入那些事儿。你是不是在数据导入的时候遇到各种状况,让人头疼不已?别担心,这篇文章给你答案!
2025-01-04 09:38:00
1369
原创 Doris BE节点下线卡住?快速排障技巧全攻略!
Doris的BE节点下线卡住,可能会让人焦头烂额。尤其是当你面对大量的数据和繁琐的操作时,如何有效排查和解决这些问题成了每一个Dori使用者的必修课。今天,我们就来聊聊那些可能导致BE节点下线失败的原因,以及一系列有效的排障技巧,让你轻松应对这些难题。
2024-12-31 08:23:46
1044
原创 Doris查询报错-230?别慌,教你几招秒解!
当你发现事务提交太频繁,可能是业务数据导入过快,导致Doris处理不过来。//这里时间XXX要用具体某分钟的时间代替,例如,当天是12月31日10点多,那么可以搜: "12-31 10:01"。grep "beginTransaction" fe.log | grep 时间XXX | wc -l通过上面的方法,可以查看一分钟有多少个事务,如果频率太高,那就需要减速了!报错-230虽然看起来令人头痛,但通过一步步的排查和优化,我们完全能够找到解决办法。记住,及时升级版本,避免高频导入。
2024-12-27 08:37:26
652
原创 Doris Tablet 损坏如何应对?能恢复数据吗?
好了,上面就是比较常见的解决办法了,还搞不好,或者不会搞怎么办?这就要学会主动出击了,找Doris社区的同学,他们都是嘎嘎热心的人!如果自己通过上面的方式修复了,但是感觉还是不合理,为什么会出现Tablet损坏的情况呢?这时候也是可以带着对应的日志去找社区的同学,让他们辅助分析一波。
2024-12-25 14:46:42
1043
原创 【Apache Doris】周FAQ集锦:第 26 期
来自金融、证券、互联网、零售、电商、物流、能源、制造、通信、企业服务等十余行业的 40+ 技术专家纷纷登台,带来精彩演讲,并与现场观众进行互动、答疑与交流,技术氛围十分浓厚。此次峰会吸引了众多大数据及数据库领域技术专家及开源爱好者的关注,现场参会者超过 500 名,线上直播吸引了数万名观众,共同见证了这场数据处理及分析领域技术盛宴。例如,如果 mv2 是基于 mv1 创建的,而 mv1 又是基于 t1 创建的,那么在刷新 mv2 时,不会考虑 mv1 与 t1 之间的数据是否同步。不需要,指定了也会忽略;
2024-12-20 22:14:42
1166
翻译 别让你的CPU打盹儿:Apache Doris并行执行原理大揭秘!
Doris的并行执行模型是一种Pipeline 执行模型,主要参考了Hyper论文中Pipeline的实现方式:Pipeline 执行模型能够充分释放多核 CPU 的计算能力,并对 Doris 的查询线程的数目进行限制,解决 Doris 的执行线程膨胀的问题。
2024-12-20 21:44:03
60
转载 「FE 倒下了,但我挺住了」—— Doris FE 挂机应急指南
在分布式系统中,意外情况的发生几乎是不可避免的。Doris FE(Frontend)作为系统的核心组件之一,承担了元数据管理和调度等关键任务,一旦发生异常,可能会对整个系统的稳定性造成影响。面对 FE "倒下"的场景,作为运维人员或技术支持,你需要的不仅是冷静,更需要一套高效、可操作的应急方案。本指南旨在从不同场景入手,帮助你快速定位问题、恢复服务,并建立高可用的应对策略,让 FE 的每一次"倒下"都成为提升系统稳定性的契机。
2024-12-19 21:24:20
89
转载 Apache Doris 数据均衡问题排查指南
当集群处于以下几种情况时,可参考本文进行问题排查。BE节点之间的数据不均单个BE节点上的多个磁盘之间的数据不均BE节点的上线和下线进度卡死(BE的tablet数量没有变化)
2024-08-29 16:21:04
454
2
原创 Apache Doris 跨集群数据同步 CCR 全面介绍
CCR(Cross Cluster Replication)也就是跨集群数据复制,能够在库/表级别将源集群的数据变更同步到目标集群,可用于提升在线服务的数据可用性、隔离在离线负载、建设两地三中心等。
2024-08-25 10:01:50
1440
原创 Apache Doris 中Compaction问题分析和典型案例
此文档主要说明一些常见compaction问题的排查思路和临时处理手段。这些问题包括- Compaction socre高- Compaction失败- compaction占用资源多- Compaction core
2024-08-15 16:00:52
1625
转载 【Apache Doris】周FAQ集锦:第 17 期
在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。
2024-07-22 12:17:41
732
原创 【西安活动邀请函】7月27 | PowerData 数字经济-“西安“开源行!
古有“长安回望绣成堆,山顶千门次第开”,西安,这座拥有深厚历史文化底蕴的古都,自古以来便是国家的重要战略中心。在漫长的历史进程中,西安不仅孕育了辉煌的文化,更在现代化进程中展现出了蓬勃的发展活力。今天,随着数字经济的飞速发展,西安继续走在时代前沿,依托数据经济的迅猛发展,展现出了前所未有的创新活力。在此背景下,PowerData将于7月27日在历史悠久、风景如画的西安举办一场以“数字经济-城市开源行”为主题的线下开源分享活动。我们深知,数据行业的发展离不开每一位数据人的辛勤付出与不懈努力。
2024-07-19 16:18:11
358
原创 如何通过Profile快速定位Doris查询瓶颈
FE的情况比较少,如果是的话,看下是否有压测/线上压力情况/是否FE有GC等等,重点去看FE的CPU的压力情况。绝大部分情况都是BE这边的,然后如果是BE这边慢的话,重点去按照后面的分析去看看各个部分的算子的情况。这个时候需要判断右表的列是不是显著的大于左表,比如右表是一个大宽表,而左表可能只扫描一列,这种情况下导致的性能问题也认为是join reorder的问题。2.1的profile经过profile merge之后,显示是很精简的,我们需要通过去看每个算子的查询时间,来看具体卡在那里。
2024-06-30 10:44:48
1440
原创 【活动邀请函】6月15 | PowerData 数字经济-“南京“开源行!
PowerData 数字经济·城市开源行将于6月15日在南京盛大举行。这是一个自由交流和思想碰撞的平台,我们将邀请行业领军人物和热门企业分享最新技术和实践经验,同时提供自由讨论和互动环节,让您与行业同仁畅所欲言。无论您是技术专家、创业者还是学术研究者,都能在这里找到知识碰撞和灵感火花。PowerData诚邀各位数据匠人共同探索数据之路,共建数据人生!
2024-06-12 10:02:22
447
原创 X2Doris使用指南:界面化数据迁移工具 - 轻松实现整库迁移至Doris
X2Doris 是 SelectDB 团队开发的,专门用于将各种离线数据迁移到 Apache Doris 中的核心工具,该工具集 自动建 Doris 表 和 数据迁移*为一体,目前支持了 **Apache Doris/Hive/Kudu/StarRocks** 数据库往 Doris 或 SelectDB Cloud 迁移的工作,整个过程可视化的平台操作,非常简单易用。
2024-05-26 20:27:18
2897
转载 【邀请函】5月18 | PowerData 数字经济·上海开源行!
为了让广大数据人在数据这条路上走得更远更稳,PowerData将于5月18号在春暖花开的上海举办以“数字经济-城市开源行”为主题的线下开源分享活动
2024-04-30 10:43:20
170
转载 【数字经济·城市脉动】PowerData 数字经济-深圳开源行,邀您共绘数字未来!
PowerData数据社区 数字经济-深圳开源行 将于4月20号与大家见面,我们将以线下分会场+线上直播”的形式举办。
2024-04-12 15:58:31
158
原创 PowerData 2024“数字经济-城市开源行”活动预告
2024,社区计划在全国十个城市举办"数字经济-城市开源行"活动,连接社区成员、传播数字技术、推广开源文化,吸引更多伙伴加入社区,共建数字开源。
2024-03-03 08:50:29
893
原创 校招面试重点汇总之Hadoop中的Yarn(不多但都是高频面试题)
本文的题目从各个公司的面试题汇总而来,属于中大厂面试中常问到的点,题目不多,但都是非常高频的题目!
2023-07-03 07:00:00
2250
1
原创 校招面试重点汇总之Hadoop中的MapReduce(不多但都是高频面试题)
本文的题目从各个公司的面试题汇总而来,属于中大厂面试中常问到的点,题目不多,但都是非常高频的题目!
2023-05-19 15:11:50
3328
1
jsp超市管理系统.zip
2021-12-30
java实现简历管理系统的下载链接.txt
2021-05-06
Calculator.java
2020-02-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人