- 博客(230)
- 收藏
- 关注
原创 Apache Doris 2.1.9 版本正式发布
亲爱的社区小伙伴们,。2.1.9 版本对湖仓一体、倒排索引、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
2025-04-03 18:04:09
157
原创 Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
在全球 290 位开发者的协作下,Apache Doris 在 2024 年完成了 7000+ 次代码提交,并发布了 22 个版本,实现在实时分析、湖仓一体和半结构化数据分析等核心场景的技术突破及创新。2025 年,社区将秉承“以场景驱动创新” 的核心理念,
2025-04-03 18:03:04
653
原创 拉卡拉 x Apache Doris:统一金融场景 OLAP 引擎,查询提速 15 倍,资源直降 52%
导读:拉卡拉早期基于 Lambda 架构构建数据系统面临存储成本高、实时写入性能差、复杂查询耗时久、组件维护复杂等问题。为此,拉卡拉选择使用 Apache Doris 替换 Elasticsearch、Hive、Hbase、TiDB、Oracle / MySQL 等组件,实现了 OLAP 引擎的统一、查询性能提升 15 倍、资源减少 52% 的显著成效。拉卡拉(股票代码 300773)是国内首家数字支付领域上市企业,从支付、货源、物流、金融、品牌和营销等各维度,助力商户、企业及金融机构数字化经营。
2025-04-02 17:55:34
724
原创 为什么 Apache Doris 是比 Elasticsearch 更好的实时分析替代方案?
Elasticsearch 是一款开源的分布式检索引擎,广泛应用于日志分析、全文搜索和数据监控等领域。凭借其强大的实时搜索能力和灵活的查询语言,在市场上获得了广泛认可。然而,在过去两年,我们注意到一个趋势,。尽管 Apache Doris 和 Elasticsearch 在表面上看似不同,但它们的应用场景却有很大的重叠。例如,Apache Doris 适用于在线高并发报表、用户画像、湖仓一体、日志与可观测性、安全分析等领域;
2025-03-27 18:09:53
883
原创 MiniMax GenAI 可观测性分析:基于阿里云 SelectDB 构建 PB 级别日志系统
回顾MiniMax可观测系统的演进历程,从初期的Loki架构到Apache Doris的引入,再到SelectDB的全面升级,每一次技术迭代都体现了MiniMax对业务需求的深刻理解和对技术创新的不懈追求。阿里云SelectDB凭借其卓越的性能、灵活的架构和强大的生态能力,为MiniMax提供了高效、稳定的日志存储与分析服务,助力其在大模型实践中实现成本与效率的最佳平衡。未来,随着MiniMax业务的持续高速发展,日志可观测系统将继续作为洞察系统运行状态和优化性能的核心工具。
2025-03-20 18:09:59
964
原创 天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践
天翼云基于和 Apache Iceberg 构建的湖仓一体方案,兼具灵活性、高性能和低成本优势,同时满足了报表和 BI 分析、湖仓融合分析、日志存储分析、高并发实时分析、MPPDB 国产化替代等多种场景需求。本文转录自李康(天翼云 大数据总监)在 Doris Summit Asia 2024 上的演讲,经编辑整理。天翼云是中国电信旗下一家科技型、平台型、服务型公司,以“云网融合、安全可信、绿色低碳、生态开放”四大优势向客户提供公有云、私有云、专属云、混合云、边缘云全栈云服务。
2025-03-18 15:04:07
765
原创 SelectDB 实时分析性能突出,宝舵成本锐减与性能显著提升的双赢之旅
成本显著降低:存量成本降低 50%,增量成本从机器费用、License 费用、厂商运维费用降低到仅需机器费用,成本直降 30%;最高写入速度提升 10 倍:最高写入速度从 20 万/分 提升至 230 万/分;查询性能大幅提升:小 SQL 查询在速度不变的情况下,资源消耗降低了 33%,大 SQL 查询性能提升 66%。
2025-03-12 18:36:42
854
原创 云原生时代的架构革新,Apache Doris 存算分离如何实现弹性与性能双重提升
随着云基础设施的成熟,正式支持了存算分离全新模式。基于这一架构,能够实现更低成本、极致弹性以及负载隔离。本文将介绍存算分离架构及其优势,并通过导入性能、查询性能、资源成本的测试,直观展现存算分离架构下的性能表现,为读者提供具体场景下的使用参考。在数据驱动决策的时代,数据规模增长加快、分析需求不断变化。数据从多种渠道(如应用日志、网络交互、移动设备等)源源不断地流入,包含结构化、半结构化、非格式化等多种数据格式,这对数据的存储和分析提出了很高的挑战。
2025-03-06 11:01:40
863
原创 从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践
导读:随着川航大规模数据导入需求增长,数据响应频繁出现卡顿,原 Hadoop +的数据架构存在着涉及组件多、并发性不足、数据导入受限的痛点。经过综合选型对比,川航选择引入建设湖仓一体大数据分析引擎,取得了等收益。本文转录自吴乐(四川航空 信息技术部 大数据架构师)在 Doris Summit Asia 2024 上的演讲,经编辑整理。
2025-03-03 11:28:32
1002
原创 Apache Doris 3.0.4 版本正式发布
亲爱的社区小伙伴们,该版本持续在存算分离、湖仓一体、异步物化视图等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。
2025-03-03 11:27:13
1139
原创 数据无界、湖仓无界,Apache Doris 湖仓一体典型场景实战指南(下篇)
湖仓一体是将数据湖和数据仓库的优势相结合的数据管理系统。结合自身特性,提出了【数据无界】和【湖仓无界】核心理念。上篇文章已介绍了,本文将聚焦典型应用场景,进一步深入,帮助读者更好地理解和应用 Apache Doris 湖仓一体。在数据驱动决策的时代,湖仓一体架构以统一存储、统一计算、统一管理的创新形式,补齐了传统数据仓库和数据湖的短板,逐步成为企业大数据解决方案新的标准。。通过这三个场景的实践,展示 Apache Doris 如何帮助企业快速响应业务需求,提升数据处理和分析的效率。
2025-02-21 12:13:18
1035
原创 数据无界、湖仓无界, Apache Doris 湖仓一体解决方案全面解读(上篇)
导读:湖仓一体架构融合了数据湖的低成本、高扩展性,以及数据仓库的高性能、强数据治理能力,高效应对大数据时代的挑战。为助力企业实现湖仓一体的建设,提出了和核心理念,并结合自身特性,助力企业加速从 0 到 1 构建湖仓体系,降低转型过程中的风险和成本。本文将对湖仓一体演进及 Apache Doris 湖仓一体方案进行介绍。在过去的数年间,数据分析技术栈经历了许多重要变革,从最初数据仓库概念的诞生,到数据湖的兴起,进而演进到湖仓一体解决方案。
2025-02-19 11:09:12
901
原创 从 ClickHouse 到 Apache Doris:在网易云音乐日增万亿日志数据场景下的落地
导读:日志数据已成为企业洞察系统状态、监控网络安全及分析业务动态的宝贵资源。网易云音乐引入作为日志库新方案,替换了 ClickHouse。解决了 ClickHouse 运维复杂、不支持倒排索引的问题。目前已经稳定运行 3 个季度,规模达到 50 台服务器, 倒排索引将全文检索性能提升7倍,2PB 数据,每天新增日志量超过万亿条,峰值写入吞吐 6GB/s。网易云音乐每天都会产生大量用户行为数据、业务数据及日志数据,这些数据在异常行为跟踪、客诉问题定位、运行状态监控、性能优化等方面扮演守护者的角色。
2025-02-14 15:28:37
1101
原创 湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构
截至目前,基于 Doris + Paimon 的实时/离线一体化湖仓架构已为反欺诈策略、用户⾏为分析、业务监控、 BI 应用等若干系统提供了服务,实现查询提速 30 倍、资源成本节省 67% 等显著成效。全面接入数据湖:逐渐扩大 Doris + Paimon 湖仓⼀体化架构的应用范围,打通存量数据湖与 Doris 数仓的对接,为日后 PB 级数据的分析做好充分准备。打造实时智能金融客服。
2025-02-13 12:01:28
1159
原创 Apache Doris 2.1.8 版本正式发布
亲爱的社区小伙伴们,该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。
2025-01-24 17:06:51
1544
原创 金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
导读:中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。本文转录自陈地长(中信信用卡中心信息技术部 高级工程师)在 Doris Summit Asia 2024 上的演讲,经编辑整理。
2025-01-21 11:26:33
2121
原创 正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
容器化凭借其灵活性、跨平台性、自动化管理和极致弹性,吸引了众多企业的关注。一些企业希望将容器化部署,以实现高效的资源利用与部署迭代。Kubernetes 提供的编排和管理功能,能完成大规模容器部署,但 Kubernetes 自身的复杂性也导致众多企业面临部署复杂、运维困难、使用难度高等挑战。该工具集成了原生 Kubernetes 资源的复杂管理能力,并融合了 Doris 组件间的分布式协同、用户集群形态的按需定制等经验,为用户提供了一个更简洁、高效、易用的容器化部署方案。
2025-01-15 11:35:50
914
原创 奖项再 +1 !飞轮科技荣获 Datafun 2024 年第二届星空奖——数智技术领航企业奖
近日,Datafun 发布 2024 年第二届星空奖名单,该奖项旨在寻找并表彰在数智技术领域享有较高声誉,技术领先、生态系统完整、拥有成熟产品与解决方案的创新企业。经过层层评审与筛选,飞轮科技凭借其卓越的技术实力及创新方案,
2025-01-03 12:19:20
488
原创 计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台
截至目前,灵犀科技基于 Apache Doris 建设的统一数据数据平台已上线并稳定运行,有效解决了数据孤岛问题,实现了数据整合与流通。在数据集成(ETL)、标准化、治理和可视化等方面取得显著进展,相较于原有的多组件架构,数据生产能力提升超过 10 倍、存储成本节省超 60%。存算分离:进一步提升资源的利用率,精细化分配存储和计算资源。大模型 BI:将 Apache Doris 作为公司智能问答大模型的知识库,支撑大模型 BI 的查询。社区和SelectDB。
2025-01-03 12:18:37
1162
原创 Apache Doris 创始人:何为“现代化”的数据仓库?
在 12 月 14 日的 Doris Summit Asia 2024 上,Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,详细介绍了所对应的核心特性的设计思考与应用价值,揭晓了 2025 年社区发展蓝图。本文节选自马如悦在 Doris Summit Asia 2024 上的演讲,以马如悦第一人称叙述,经编辑。
2024-12-26 18:10:32
1216
原创 飞轮科技荣获中国电信星海大数据最佳合作伙伴奖!
在产品合作方面,飞轮科技为中国电信引入了现代化数据仓库 SelectDB,该产品基于 Apache Doris 内核构建,通过实时、统一、弹性、开放的核心能力,为企业提供高性价比、简单易用、安全稳定、低成本的实时大数据分析支持,以及更加安全、稳定的开发和使用体验。在业务支持方面,飞轮科技与各省电信携手共进,共同推进了多个外部项目合作,为中国电信的数据业务发展注入了新的活力。未来,飞轮科技将继续与中国电信及更多合作伙伴携手并进,持续深化在数据分析领域的生态合作,共同驱动数据技术的持续进步。
2024-12-26 18:09:46
286
原创 一文了解多云原生的现代化实时数仓 SelectDB Cloud
随着数字化转型的加速,云计算已成为现代企业运营中的关键组成部分。云的重要性体现在多个方面:首先,它提供更好的灵活性与可扩展性,可根据实际需求动态调整计算和存储资源,以快速适应市场变化并支持业务增长。其次,其采用按需计费的模式,使企业能够有效控制成本,避免高昂的硬件投资和维护费用。飞轮科技作为 Apache Doris 的商业化公司,基于其内核自主研发了现代多云原生实时数据仓库 SelectDB Cloud,充分利用云原生能力,为客户提供极致性价比、融合统一、简单易用、安全稳定的云上数据分析服务。自推出至
2024-12-24 17:07:59
1277
4
原创 峰会快讯:Doris Summit Asia 2024 圆满落幕!
2024 年 12 月 14 日,由飞轮科技主办,腾讯云和阿里云联合主办的 Doris Summit Asia 2024 在深圳圆满落幕。活动当天,人潮涌动,会场弥漫着浓厚的技术气息。此次峰会吸引了众多大数据及数据库领域技术专家及开源爱好者的关注,现场参会者超过 500 名,线上直播吸引了数万名观众,共同见证了这场数据处理及分析领域技术盛宴。
2024-12-19 11:53:43
901
原创 Apache Doris 3.0.3 版本正式发布
修复关闭 light_schema_change 时使用 VARIANT 类型 coredump 的问题。修复 meta-service 接收到 RPC 时不严格检查 instance_id 的问题。修复 hash join 时 array 类型的大小超过 4G 导致 BE Core 的问题。修复 varchar 和 char 类型在 runtime filter 运算时的问题。修复常量折叠 RCP 以及 FE 转发 SQL 可能不在预期的计算组执行的问题。
2024-12-09 18:20:04
1313
原创 Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
导读:Cisco WebEx 早期数据平台采用了多系统架构(包括 Trino、Pinot、Iceberg 、 Kyuubi 等),面临架构复杂、数据冗余存储、运维困难、资源利用率低、数据时效性差等问题。因此,引入 Apache Doris 替换了 Trino、Pinot 、 Iceberg 及 Kyuubi 技术栈,依赖于 Doris 的实时数据湖能力及高性能 OLAP 分析能力,统一数据湖仓及查询分析引擎,显著提升了查询性能及系统稳定性,同时实现资源成本降低 30%。
2024-11-29 11:47:28
1576
原创 12 月 14 日,Doris Summit Asia 2024 议程正式公开,线下报名现已启动!
为契合不同领域用户的聆听需求,Doris Summit Asia 2024 设置了智慧金融、泛互联网、政企与智造,以及 SelectDB 专场四大平行论坛,届时,来自阿里、腾讯、邮储银行、中信证券、中国电信、网易、京东、百度、知乎、福特中国、三星、四川航空、特步、货拉拉等 40+ 知名企业的技术专家为现场及线上参会者带来精彩分享。此次峰会,将对实时极速、存算分离、湖仓一体、半结构化数据分析、向量索引、异步物化视图等诸多特性进行全方位解读,为现场观众带来一场技术与思维碰撞的盛宴。
2024-11-25 18:41:12
522
原创 Apache Doris 2.1.7 版本正式发布
亲爱的社区小伙伴们,Apache Doris 2.1.7 版本已于 2024 年 11 月 10 日正式发布。2.1.7 版本持续升级改进,同时在湖仓一体、异步物化视图、半结构化数据管理、查询优化器、执行引擎、存储管理、以及权限管理等方面完成了若干修复。欢迎大家下载使用。
2024-11-13 12:11:19
1326
1
原创 8+ 典型分析场景,25+ 标杆案例,Apache Doris 和 SelectDB 精选案例集(2024版)电子版上线
当前,各企业正面临前所未有的数据增量,不仅体现在数据规模的急剧上升,还体现在数据的类型多样性和产生速度的加快。数据体量大固然蕴藏着更大的潜力及可能性,但如何有效利用这些数据,解决实际问题、赋能业务增长,才是各企业发展的关键。因此,企业亟需搭建高效的数据处理与分析平台,以帮助其从海量数据中提取有价值的信息。作为开源的现代化数据仓库项目,Apache Doris 自诞生以来便以其强大的实时分析能力著称,它够对大规模数据进行极速分析,满足报表分析、即席查询、统一数仓构建、湖仓一体等多种使用场景。
2024-11-07 11:57:48
1208
原创 阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步
以上即为将 MySQL 整库实时同步至 SelectDB Cloud 的具体操作步骤。通过使用 Dataworks,您能够高效地将 MySQL 数据库同步至 SelectDB Enterprise、SelectDB Cloud、阿里云数据库 SelectDB 版与 Apache Doris 中,确保业务连续性不受影响。同时,凭借 SelectDB 极速分析性能和灵活弹性优势,您能够加速决策过程,优化业务运营效率,推动业务持续稳健增长。
2024-11-07 11:56:55
1294
原创 Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
亲爱的社区小伙伴们,我们很高兴地向大家宣布,在近期我们迎来了 Apache Doris 3.0 版本的正式发布,欢迎大家下载使用体验!3.0 版本是 Apache Doris 在湖仓一体演化路线上的重要里程碑版本。在 3.0 版本中 Apache Doris 增加了数据湖写回功能,用户可以在 Apache Doris 中完成多个数据源之间的数据分析、共享、处理、存储操作。结合异步物化视图等能力,Apache Doris 可以作为企业统一的湖仓数据处理引擎,帮助用户更好的管理湖、仓、数据库中的数据。
2024-10-16 19:38:45
1934
原创 从 Elasticsearch 到 Apache Doris 腾讯音乐内容库升级,统一搜索分析引擎,成本直降 80%
Doris 能够处理更长的 SQL 语句。并且在同一个引擎内,可以通过物化视图和 BITMAP 类型轻松对查询后的中间结果进一步优化,避免了不同引擎之间的跨网络同步。
2024-10-12 11:20:48
1418
原创 Apache Doris 2.0.15 版本发布
亲爱的社区小伙伴们,Apache Doris 2.0.15 版本已于 2024 年 9 月 30 日正式与大家见面,该版本提交了 157 个改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。
2024-10-12 11:19:25
568
原创 快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
导读:快手 OLAP 系统为内外多个场景提供数据服务,每天承载近 10 亿的查询请求。原有湖仓分离架构,由离线数据湖和实时数仓组成,面临存储冗余、资源抢占、治理复杂、查询调优难等问题。通过引入湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。作者快手大数据架构师 李振炜、曾斯维、周思闽在当今这个数据洪流的信息时代下,数据已跃升为企业不可或缺的核心资产。
2024-09-27 14:47:09
1313
原创 飞轮科技携手观测云亮相云栖大会,全方位展示阿里云数据库 SelectDB 版核心优势
阿里云数据库 SelectDB 是现代化实时数据仓库 SelectDB 在阿里云上的全托管服务,是阿里云的一方产品,旨在满足企业级大数据分析需求,广泛应用于实时报表分析、即席多维分析、日志检索分析、湖仓一体分析等场景,致力于为客户提供极致性能、简单易用的数据分析服务。不仅如此,阿里云 SelectDB 不断拓展应用场景边界,除更好适配常见分析场景外,还突破了日志检索分析、Data Serving、Lakehouse 等场景痛点,为用户提供了更加广泛灵活的解决方案。
2024-09-27 14:45:31
410
原创 Apache Doris 2.1.6 版本正式发布
亲爱的社区小伙伴们,2.1.6 版本在 Lakehouse、异步物化视图、半结构化数据管理持续升级改进,同时在查询优化器、执行引擎、存储管理、数据导入与导出以及权限管理等方面完成了若干修复。欢迎大家下载使用。
2024-09-20 11:05:50
1344
原创 查询性能提升 10 倍、存储空间节省 65%,Apache Doris 半结构化数据分析方案及典型场景
随着业务的蓬勃发展,各企业对数据处理的灵活性和可扩展性提出了更高的要求。在此背景下,JSON、XML 等半结构化数据凭借其较强的灵活性在众多企业得到广泛应用。然而,传统关系型数据库结构严格,难以应对半结构化数据的复杂性及多样性。本文我们将聚焦企业最普遍使用的 JSON 数据,分别介绍业界传统方案以及半结构化数据存储分析的三种方案,并通过图表直观展示这些方案的优势与不足。同时,结合具体应用场景,分享不同需求场景下的使用方式,帮助用户快速选择最合适的 JSON 数据存储及分析方案。
2024-09-13 10:58:15
1469
原创 Apache Doris Flink Connector 24.0.0 版本正式发布
亲爱的社区伙伴们,Apache Doris Flink Connector 24.0.0 版本已于 2024 年 9 月 5 日正式发布。该版本新增了对 Flink 1.20 的支持,并支持通过高速读取 Doris 中数据。此外,整库同步所依赖的 FlinkCDC,也需升级至 3.1.x 版本,以便更好的应用。
2024-09-11 17:50:58
819
原创 SelectDB 多计算集群核心设计要点揭秘与场景应用
为了达到数据的强一致访问,SelectDB 不仅实现了数据的共享化,也进行了深度重构,实现元数据的共享化:当数据通过其中一个集群写入共享存储后,会先更新共享的元数据,再返回数据写入结果。如果能引入多个计算集群,通过独立的计算集群分别进行写入、读取操作,即使在写入压力非常高时,也可放心执行计算任务,无需担心影响到服务的稳定性。对于计算集群的使用,SelectDB 提供一套简单易用的权限机制,集群支持类似库表的权限分配机制,只有给用户分配了某集群的权限,用户才可以使用该集群,从而避免集群误用情况。
2024-09-11 17:49:56
1471
原创 兼容Trino Connector,扩展Apache Doris数据源接入能力|Lakehouse 使用手册(四)
Apache Doris 内置支持包括 Hive、、LakeSoul、JDBC 在内的多种 Catalog,并为其提供原生高性能且稳定的访问能力,以满足与数据湖的集成需求。而随着 Apache Doris 用户的增加,新的数据源连接需求也随之增加。因此,Trino/Presto 作为业界较早应用于湖仓查询、联邦分析的计算引擎,以广泛的数据源对接能力闻名。
2024-09-06 12:14:15
1621
1
《SelectDB 新一代日志存储与分析解决方案白皮书》
2024-06-19
Apache Doris 用户案例集
2023-06-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人