- 博客(67)
- 收藏
- 关注
原创 02 Oracle日志系统:一条SQL更新语句是如何执行的
在这篇文章中,我们以一条更新SQL的视角,给大家介绍了Oracle数据库是如何处理DML语句的。通过这个过程我们可以看到,所有变更操作都是在内存中完成的,这里的内存操作包括Redo Log Buffer中记录的数据操作日志和Buffer Cache中对数据块的变更。当用户确认提交后,会将Redo Log Buffer记录同步写出到在线重做日志文件,而Buffer Cache中被修改的数据块,则会放入到“脏块”链表,基于一定的机制异步写出到数据文件中。
2024-08-02 13:29:08
944
原创 彻底搞懂Oracle直方图
Oracle直方图的概念相对复杂,涉及到的知识点比较多,通过一篇文章梳理不同直方图的生成原理和使用场景,帮助大家更好的理解和运用直方图解决实际生产问题。
2024-07-28 20:38:06
1892
原创 数据库国产化后,还需要dba吗
总结以上几点,数据库的作用变了,应用形态变了,市场环境也变了。有人会说等过几年国产数据库的市场格局确立,积累了足够经验之后,DBA 还会有再次证明自己价值的机会。而号主要说,这样的机会大概率不会再有了,从去数据库中心化开始就决定这个 DBA 行业注定也将会回归。但也不必过于悲观,数据的价值在未来会更加重要,数据库作为离数据最紧密的载体,其作用当然也无可替代。而 DBA 作为对数据库功能特性最熟悉的群体,我们也要转变自己的思路,从“伺候”数据库到“利用”数据库,向数据要价值,从而发挥出自己的价值!
2025-11-17 21:37:48
949
原创 3种数据模型的演变
上述三种数据模型的是依次演进的,每种模型解决了上一代模型存在的问题,同时自身也存在优化的空间,因此也在不断演进。关系模型以一种简单的方式描述现实世界,因此在推出后受到了广泛的关注,由此发展成为当下最重要的数据模型。但对于当前非结构化的数据,关系模型仍然存在不小的局限,因此近些年又演进出面向对象数据模型、半结构化的 XML 数据模型、键值对数据模型、文档和图数据模型等等,由此也涌现了种类繁多的新型数据库,在各种不同的应用场景中发挥自己的作用。
2025-11-16 23:34:48
295
原创 数据建模及其相关概念
设计一个应用系统前,通常需要将现实世界中所涉及到的对象成实体(Entity),分析实体相关的属性,以及与其他实体之间存在的关联,形成 ER 关系图;将 ER 关系图以数据库能够理解的语言转换成数据模型;最后在数据库中创建出相关的对象,供应用系统保存和访问数据。这便是一个最简单、最基础的数据建模过程。
2025-11-16 11:52:01
320
原创 数据管理技术发展的3个阶段
数据管理技术经历了三个阶段演变:人工管理阶段(50年代中期前)使用外部介质存储,数据与程序强耦合;文件系统阶段(50-60年代中期)通过操作系统管理文件数据,但仍缺乏结构化组织;数据库系统阶段(60年代后期起)实现了数据的结构化存储、多应用共享和独立性,由DBMS统一管理。这一演进过程与计算机软硬件发展同步,最终使数据从孤立存储发展为可共享的企业资源。
2025-11-10 22:45:48
329
原创 数据库的4个基本概念
本文介绍了数据库领域的四个基础概念:数据、数据库、数据库管理系统(DBMS)和数据库系统。数据是描述事物的符号记录,包括数字、文本、图像等多种形式;数据库是有组织的、可共享的数据集合;DBMS是管理数据库的软件,提供数据定义、存储、操作等功能;数据库系统则是由数据库、DBMS、应用系统和数据库管理员组成的完整体系。文章强调区分"数据库"(静态存储)和"数据库管理系统"(动态管理软件)的区别,并提及了国内外主流数据库产品,包括国产数据库的发展情况。
2025-11-10 11:31:35
627
原创 YMatrix 通过“可信数据库”测评!超融合架构能否成为未来趋势?
北京四维纵横数据技术有限公司( YMatrix )成立于 2020 年 8 月,是一家专注于新一代数据基础设施的创新型基础软件公司,为企业提供相关软件产品及一站式解决方案。公司创始团队均来自 Oracle、IBM、Teradata 和 Greenplum 等国际一线数据库企业,致力于创造智能化、高性能、低成本的数据产品,持续推动数据智能技术的突破与发展,为客户创造长期价值。
2025-11-10 10:03:33
826
原创 MongoDB 的崛起与挑战:一场长达八年“不盈利”的豪赌
MongoDB发展历程与现状分析 摘要:MongoDB作为NoSQL数据库的领导者,自2007年诞生以来经历了快速发展。其灵活的文档数据模型和分布式架构获得广泛认可,2016年推出的Atlas云服务改变了商业模式,目前贡献公司74%营收。尽管2024年首次实现单季度盈利,但8年来仍处于整体亏损状态,研发和营销投入占比高达74%。MongoDB的案例反映出数据库行业需要长期投入的特性,也引发对国产数据库发展模式的思考。
2025-11-03 22:31:04
766
原创 聊聊Oracle数据库的向量能力
摘要:Oracle数据库在23.4版本引入Vector数据类型,支持AI驱动的向量处理能力。通过DENSE和SPARSE两种存储格式,Oracle能高效管理高维向量数据。其突出优势在于对向量处理全流程的支持,包括文档分块、分词、嵌入等操作,并内置ONNX模型转换工具,实现数据库内完整的向量化流程闭环。相较于同类产品,Oracle无需依赖外部工具即可完成复杂的向量处理,为AI应用提供了强大的原生支持。后续将详细介绍向量索引等高级功能。
2025-11-03 21:50:42
1140
原创 国产CPU之光,曾经世界超算领域的天花板
摘要:申威处理器起源于DEC Alpha指令集,2006年由无锡江南计算所自主研发SW-1处理器,形成多线程、高性能单核和多核三大产品线。2016年"神威·太湖之光"超算搭载4万颗申威26010登顶全球第一。申威专注于国防和超算领域,采用自主SW-64指令集规避外部风险,但在民用PC市场仍待突破。当前正布局信创生态,未来面临软件生态和市场化的双重挑战。(149字)
2025-10-09 16:08:23
348
原创 Oracle大会临近,23ai 本地版会发布吗?
摘要: 2025年Oracle大会聚焦AI与云计算,回顾历年大会重点:2015年进军云服务,2018年推出自治数据库,2024年更名CloudWorld并强化AI功能。23ai本地版迟迟未发布,可能因Oracle战略转向公有云、市场需求减少及硬件兼容问题。国内“去O”趋势明显,19c仍为主流,23ai与国内市场需求脱节,国内外数据库发展路径或将分化。
2025-10-09 16:06:20
530
原创 Oracle不再支持该系统,一代王者终到末路
纵观 Oracle 的发展历史,“远交近攻”一直是其核心市场策略。所谓“近攻”就是对同行业竞品的攻击策略,比如数据库领域的 DB2、SQL Server 等都曾是 Larry 讨伐的对象;而“远交”则是联合非直接竞争对手中的强者,双方充分发挥自己的优势,打造更强的产品。例如,HP 服务器如日中天的时候,HP 是 Oracle 最好的合作伙伴;云计算时代,Oracle 推出多云战略,和微软 Azure、Google Cloud 以及 AWS 都结成了战略合作伙伴关系;
2025-09-06 22:44:56
968
原创 Oracle是如何成为云计算领导者的
十年磨一剑,从 2012 年推出第一代云平台时的冷眼相待,到如今逐渐进入主流阵营;从传统数据库霸主,华丽转身为云计算领域的领导者,甲骨文走出了一条属于自己的逆袭之路。甲骨文在数据库领域并不是先发者,之后的事情大家都知道了。同样在云计算行业也一直在扮演追赶者的角色,而今乘着 AI 的东风,甲骨文也在快速的继续书写着自己的传奇!
2025-09-06 22:31:07
1257
原创 分而治之还是一统天下,国产数据库半年盘点
自 2019 年数据库国产化兴起至今已是第 6 个年头,有些厂商从激烈的市场竞争中脱颖而出,有些则如流星短暂闪耀后消失在历史长河,而更多的仍然在为实现最初的梦想而坚持着。数据库产品研发是一个方向,提供以数据库为核心的综合解决方案也是一个很好的方向,相信只要找对方向,市场终究会给出合理的回报!
2025-07-23 06:38:30
517
原创 上市5年还未盈利,数据仓库领域卷上天
江山代有人才出,Snowflake 作为曾经的破局者打破了传统数据仓库的技术架构,如今也面临被湖仓一体和 AI 技术挑战的局面。在这些被挑战的领域,Snowflake 也在发力跟进,利用生成式 AI 能力,从“分析工具”向“智能决策引擎”全面升级,推动数据价值向决策链条的最前端延伸。科技仍在进步,竞争仍在持续,数仓领域的精彩一点也不逊于传统数据库。未来的技术路线如何演绎,国产数仓产品又将如何破局,后续的文章我们再分享!
2025-07-23 06:36:52
741
原创 Databricks 是如何成长为 620亿独角兽的
大数据领域的技术迭代非常快,从批处理到实时计算再到湖仓一体,其中涌现出一大波优秀的产品和公司。这些产品在开源社区和商业化公司的持续推动下不断进化,至今仍然活跃在市场上,也有一些产品在新技术的冲击下逐渐没落,慢慢的淡出了主流市场。而一款成功的开源产品离不开其背后强大的商业化公司,究其根本原因,商业化公司给开源产品提供了绝佳的试错环境和真实案例,开源产品在真实的需求中得到验证和完善,从而快速的成长起来。
2025-06-23 16:50:12
1109
原创 Oracle股价再创历史新高,ai时代数据库还是一门好生意吗?
从最先对云计算不屑一顾到全面转云,通过改造为多租户架构,推出云上自治数据库等一系列大刀阔斧的创新,使得 Oracle 成为最好用的云数据库。ai 时代背景下,充足的算力储备让 Oracle 云成为市场的宠儿,而 ai 技术的发展让数据库再次成为企业应用架构中的核心,一系列的利好使得 Oracle 营收不断抬升,也再次成为资本市场的宠儿。作为数据库从业人员,如何抓住时代的机会,利用自己的数据库经验,创造出更多的价值呢?欢迎大家留言讨论!公众号:数据最前线。
2025-06-23 16:45:48
614
原创 OceanBase 开发者大会,拥抱 Data*AI 战略,构建 AI 数据底座
OceanBase 架构演进上有两个最重要的版本迭代,一是 2016 年 1.0 版本实现了所有节点的可读可写,另一个是 2020 年的 4.0 版本提出的单机分布式一体化架构,能够在一套系统中同时实现分布式的扩展性和单机性能。在 AP 负载下,存储成本最高可降低为原来的 1/10。OceanBase 的 Data*AI 战略,致力于打造一个数据底座,通过一套架构同时支持 TP/AP/AI 混合负载,既支持向量检索,又能实现 SQL 与 AI 的混合检索,实现数据与模型的深度一体化融合。
2025-05-21 22:31:40
1418
原创 Redis 8.0 GA,重回开源
Redis 8.0 的发布不仅是一次性能升级,更是其生态战略的关键转折点。通过开放核心功能与整合社区资源,Redis 正从“高性能缓存”向“全场景实时数据平台”演进。未来,随着 AI 与物联网应用的深化,Redis 或将进一步强化向量搜索、时序分析等领域的竞争力,巩固其在实时数据处理领域的霸主地位。
2025-05-21 22:28:03
1411
原创 创业艰难,这家数据库公司上市3年还未盈利
星环科技自2013年成立以来,专注于企业级大数据和人工智能软件的研发,提供数据全生命周期的基础软件与服务。公司产品涵盖大数据与云基础平台、分布式数据库、智能分析工具等多个领域,已在十几个行业应用落地,拥有超过1500家终端用户。尽管在2022年成功登陆科创板,但公司上市后业绩不佳,2024年净利润亏损扩大至3.43亿,营收能力未见显著提升。公司主要通过永久授权模式销售软件产品,但新客户拓展困难,老客户复购率有限。庞大的产品线导致高额研发投入,2024年研发费用占营业收入的70%以上,但产品市场排名并不突出。
2025-05-08 22:11:26
1182
原创 这家公司从盈利到亏损,数据库产品研发到底赚不赚钱
回到文章的标题,做数据库产品到底赚钱吗?当下国产数据库是一个竞争非常激烈的红海市场,产品的快速迭代、市场宣传以及客户推广都需要大量的资源投入,而且这个投入至少是以5年为周期的。海量数据在最近3年投入了近5亿的研发成本,从2025年一季度的营收看接近于保本状态,是否能够持续还有待于进一步观察。但海量是上市公司有家底可以投入,对于那些还没有上市的公司来说,如何保证足够的资金持续投入,又如何能在这激烈的竞争环境中活下来,这些都是非常考验智慧和魄力的。
2025-05-08 22:04:42
1384
原创 Doris Schema变更机制解析与管理实践
虽然 Oracle 也有不少场景支持轻量级的 Schema 变更,但是似乎并没有整理出类似的概念。Doris 等新型数据库将这些场景独立出来,并大大扩展了其支持场景。一方面是 Oracle 数据库在设计上比较严谨,严格遵守 ACID 原则,不允许中间状态出现;另一方面也和 Doris 所管理的数据体量和应用场景有关,毕竟要修改动辄上 TB 规模的表结构,还是一件毕竟危险的动作,需要数据库提供相应的能力来尽可能的规避风险。
2025-05-03 10:05:14
865
原创 Doris索引机制全解析,如何用高效索引加速数据分析
最后为了大家学习的方便,将各种索引的优缺点汇总如下。类型索引优点局限点查索引前缀索引内置索引,性能最好一个表只有一组前缀索引点查索引倒排索引支持分词和关键词匹配,任意列可建索引,多条件组合,持续增加函数加速索引存储空间较大,与原始数据相当跳数索引ZoneMap 索引内置索引,索引存储空间小支持的查询类型少,只支持等于、范围跳数索引BloomFilter 索引比 ZoneMap 更精细,索引空间中等支持的查询类型少,只支持等于跳数索引。
2025-04-30 11:44:29
1218
原创 Doris表设计与分区策略:让海量数据管理更高效
为了确保数据均匀分布在各 BE 节点,避免数据倾斜导致部分节点过载,Doris 引入了分区和分桶两层逻辑对数据进行划分。分区和传统数据库没有本质的区别,主要是从业务逻辑的角度对数据进行划分;而分桶则是基于 Hash 或 Random 算法直接将数据从物理层面进一步打散。数据写入时,Doris 根据表的分区策略将数据行分配到对应的分区,并根据分桶策略将数据进一步映射到分区内的具体分片,从而确定数据行的存储位置。分片是 Doris 中数据管理的最小单元,也是数据移动和复制的基本单位;
2025-04-25 19:48:54
1133
原创 聊聊Doris的数据模型,如何用结构化设计解决实时分析难题
模型类型数据特征典型场景性能优势明细模型原始数据、高基数维度日志分析、Ad-hoc查询灵活查询聚合模型固定维度、数值型指标日报表、监控看板查询速度提升100倍主键模型频繁更新、点查为主用户画像、实时库存支持高并发点查实时分析场景是 Doris 的立足之本,致力于打造速度最快且最具成本效益的分析型数据库,而数据模型是实现这一目标的基础。传统 OLTP 数据库大多数使用明细模对数据进行直接的存储,而不做额外的处理和加工,好处是插入性能好,满足高响应低延时的业务系统需求;
2025-04-19 21:50:07
1206
原创 Doris,新一代实时数仓核心基础设施
2017年将其捐赠给Apache基金会并更名为Doris, 之后进入Apache孵化器,迅速吸引了包括美团、京东、小米等互联网企业的关注,在架构和能力上获得了非常大的改进,支持数千节点级的扩展,引入向量化执行引擎,TPC-H性能提升3-5倍,并实现了存算分离架构原型;Doris具有高效的更新能力,主键模型支持UPSERT操作和部分列更新技术,避免全行重写开销,Kafka的实时流摄入能够将延时控制毫秒级,通过预聚合Rollup自动匹配查询和增量刷新机制,物化视图能够捕获数据秒级变化,实现实时查询。
2025-04-19 15:33:25
1261
原创 obdiag,OceanBase “菜鸟”变专家的利器
总体来说,obdiag 是一款非常优秀且全面的 OceanBase 数据库运维工具,集群巡检、集群洞察等功能便于管理员获取到集群和数据库的运行状态;诊断分析功能能够对系统运行状态进行分析,生成趋势性的图表,便于管理员进一步分析问题的原因;根因分析则集成了多个故障场景的分析实践,快速定位故障原因并给出处理建议。值得一提的是,智能运维工具的引入能够大大降低数据库的使用门槛,对于国产数据库的技术普及和市场推广有非常大的好处,毕竟人们总是更愿意使用自己能够掌控的技术。希望未来能看到更多优秀的国产数据库管理工具!
2025-04-13 17:57:25
636
原创 Oracle SQL语句子游标暴涨?这几招轻松搞定
字符串变长导致的游标不能共享而像Java等高级语言中,并没有严格限定字符串的长度,比较难从应用程序的角度控制类似问题的发生。为此在Bug 2450264 - Add event to improve cursor sharability on BIND_LENGTH_UPGRADEABLE中,Oracle引入了Event 10503,通过该事件可以将字符串设置为固定的长度,如2000,避免绑定变量带入的不同长度,导致多个子游标的出现。万能的"治标"方案。
2025-03-29 22:46:25
855
原创 DeepSeek smallpond为何选中DuckDB?轻量级分析数据库的“屠龙术“
几年前我还沉浸在以Oracle为主流的传统关系型数据库中不可自拔,以为这就是世界之巅。而当跳出Oracle视野再看时,才发现在这之外还有另一番更为广袤的天地。这里的物种功能没有那么强大,可能还存在诸多的限制,因此它们更多的以合作的形态与其他物种共存,在一个大的体系中,每个个体都贡献自己最擅长的能力,这种搭配产生了很多让人惊艳的作品。多样化的应用场景催生了多样的需求,在AI时代,轻量工具通过生态协作,正在重新定义数据处理的可能性。
2025-03-25 23:13:29
1365
原创 想不到Oracle也有“事务回卷”,后果很严重
事务回卷是 PostgreSQL 数据库中非常经典的问题,事务 ID 采用 32 位实现,理论上最大支持 4 Billion 个事务(32 位无符号数,xid 最大能够达到 42 亿),但因为 XID 是循环复用的,新老事务相差的上限是 2 Billion,当达到 2 Billion 的上限时会进行事务”回卷“,可能导致新事务被误判早于旧事务,从而破坏 MVCC 机制,极端情况下会导致数据库强制关闭。每个事务关联到一个 Undo 段,段头包含事务槽(Transaction Slot),记录事务的状态。
2025-03-25 23:09:31
1116
原创 再聊OceanBase多副本和高可用
分布式架构的发展始于互联网时代对高并发与高可用需求的爆发,从早期的集中式单体系统逐步演变为以水平扩展为核心的分布式体系。通过引入数据分片、副本容错、共识算法(如Paxos/Raft)等技术,解决了单点故障与性能瓶颈。随后,微服务、容器化(如Kubernetes)和云原生技术进一步推动架构解耦与弹性伸缩,而Serverless与边缘计算则拓展了分布式边界。如今,结合AI与大数据,分布式架构正朝着智能化、自适应方向演进,成为支撑全球数字化浪潮的核心基石。
2025-02-23 18:01:25
860
原创 OceanBase 是如何实现高可用的
高可用是分布式架构设计最原始的目标,以小型机和存储为代表集中式架构成本高昂,因此人们想用价格相对低廉的 PC 服务器来替代集中式架构。但彼时的 PC 服务器可靠性和小型机差距甚远,为了规避硬件风险设计了分布式架构。分布式架构没有中心节点,各节点之间没有强依赖关系,同时每个组件又有冗余,架构上不存在单点的隐患。具体到 OceanBase 数据库,从上层的 OB Proxy,到物理节点架构的 Zone,以及数据存储副本,每个环节都有相应的冗余保护机制,少量的节点损坏并不会影响整个集群的正常工作。
2025-02-21 10:48:34
872
原创 聊聊Oracle自适应查询优化
为了SQL语句能够始终以最优的执行计划执行,Oracle在不断的探索和革新。从9i的绑定变量Peeking,到11g的ACS和Statistics Feedback,在12c中则引入了Adaptive Query Optimization。Statistics Feedback在SQL第一次执行时,根据统计信息生成的执行计划执行SQL,执行过程中执行计划不能改变,如果统计信息不准确,在SQL第一次执行时可能就会引起灾难性的问题。
2024-12-12 18:15:09
892
原创 07 初识 Oracle 优化器
在具体介绍优化器之前,我们先普及一下执行计划的概念。所谓执行计划,是数据库在接收到SQL语句执行请求后,由优化器根据数据库表结构、索引信息以及其他必要信息生成的一个内部数据访问策略,这个策略详细描述了数据库引擎如何将SQL语句转化为一系列的操作步骤,从数据库中获取到最终的执行结果。通过执行计划,我们可以了解到数据库引擎如何访问表、如何使用索引,多表之间如何关联以及相关的其他操作,是数据库性能优化的重要分析工具。这篇文章和大家探讨了优化器和执行计划的关系,执行计划是如何工作的,又该如何阅读执行计划。
2024-11-25 20:32:20
989
1
原创 突发:Oracle 23ai 发布时间再次推迟,还有一个好消息
最初计划的发布时间是在 CY2024的上半年,2024年5月份为了凸显新版本数据库在 AI 领域的新功能,Oracle 将其更名为 Oracle 23ai,并正式发布了云上版本,同时 OP 版的发布时间也被推迟到了 CY2024 的下半年。近日笔者在查看 Oracle 数据库版本策略时发现,Oracle MOS更新了版本发布文档 Doc. 742060.1,Oracle 23ai OP 版的发布时间被推迟到 CY2025,也即是 2025年。
2024-11-23 10:16:09
807
原创 MySQL & PostgreSQL,谁是世界第一开源数据库?
对于用户来说,选择数据库并不是一件容易的事情,不仅要考虑这个产品未来的 10年是否还存在,更要考虑是否能够随着时间的推移而发展,满足未来的技术需求。对于有志于在数据库领域长远发展的厂商来说,选择合适的来源路线来发展自己的产品,更是关乎生死存亡的大事,谁又愿意把自己的未来放到不确定的路线上呢!MySQL 受限于所有权归属和开源协议,在和 PostgreSQL 的开源头号交椅的对决中落了下风,但这个问题有解吗?个人觉得很难。
2024-11-19 12:12:11
861
原创 Oracle Real time SPM, DBA的工作并非不可替代
类似于 SPM,Oracle 有的很多功能都是这样的不断迭代进化的。比如 OMF (Oracle Managed Files) 最初只是在 10g 引入的一个新概念,刚推出来时也没觉得有什么很大的用途,但是在随后的版本中,Oracle 在 快速恢复区和 ASM 中广泛使用 OMF,使用这种方式能够从数据库层面实现数据文件、归档日志文件及闪回日志等的自动管理,不需要从操作系统上再去对数据库相关文件进行手工操作,一方面提高了管理效率,另一方面也避免从外部操作数据库文件,大大降低了运维风险。
2024-11-11 11:15:25
1054
原创 23ai 的这个功能,让 DBA 离失业又更进一步
Oracle 23ai 已经正式发布一段时间了,不过由于OP版只能在 Oracle Engineer System 上使用,所以在我们接触到的客户中真正使用 23ai 非常少。最近我们借助于 Oracle 提供的 Free 版本,针对新特性进行了系统的分析和学习,发现 23ai 真的是将 AI 功能贯彻的非常彻底的一个版本,以至于我都怀疑 DBA 是不是真的会失业!本篇是 23ai 新特性系列文章的第一篇,介绍 SQL 分析报告,对新技术特性感兴趣的朋友可以点个关注,大家一起来学习。
2024-11-05 22:48:38
1662
原创 从DBA是“擦车的”谈起
昨天已经发布了新一期的安全可信评测入围产品,意味着国产数据库的竞争已经到了下半场,没有进入名单的数据库,基本已经被排除在国央企的采购清单之外,未来的发展空间基本被定格。但是即使进入了名单并不意味着能够高枕无忧,下半场比拼的将会是生态建设的持久战。这个世界都是很现实的,当其他人没办法通过你的产品赚到钱的时候,还会有人用你的产品吗?最后再回到开头的话题,研发抛头露面是一件值得骄傲的事情吗?这恰恰说明产品还远未成熟,市场生态仍然亟待完善,从整个产品生态上来说,需要做的工作还很多很多。
2024-10-02 21:16:32
1029
5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅