- 博客(126)
- 资源 (3)
- 问答 (1)
- 收藏
- 关注
原创 金融数据库转型实战读后感
而且这里还给出了OceanBase的表、字段和索引的设计以及SQL编写的最佳实践,同时解释了为什么这样。然后我发现这些和我日常主张的用通辽语录的风格来说:不能说100%想同,那也是严丝合缝的高度一致。投入是较大的,如何让这个巨大的投入减少这是我们要考虑的。但是如何记住公式,如何背单词,如何做笔记这些都是相同的,每个人可以结合自身的体会去阅读。我在这里讲讲我的感受。第六章性能调优实战章节除了通用的优化原理还讲到了OceanBase独有的优化点,使用OceanBase的用户可以看看独有的这部分。
2025-04-17 20:04:31
383
原创 Before & After:SQL整容级优化
就上面的SQL而言,我和对方说,你这个就是t1和t2关联,每一个字段都去关联循环一次,这样平白无故多做了很多次。其实把他放在一行一次性可以完成。这种时候一定要举例。拿一个样品 A和B两个表模拟原始写法是这样的那么我给的改写建议是这样的从这两个来说结果一致的,可以说基本是等效的。那么看原始的执行效果一共有三步access执行,最终发生了31次逻辑读。而改写的执行效果一共有两步access执行,最终发生了12次逻辑读。毕竟我少一层括号。而真实的SQL如果改写了,那么就不是一层,那是几十层了。
2025-04-14 22:17:54
386
原创 OceanBase单机版保姆级安装
原因很简单,分布式数据库在大规模场景是必须的,但是绝大多数公司不是大规模场景。看到北上广又是地铁又是高架还拥堵的,毕竟这种规模在中国就几个。绝大多数区县,没有地铁和高架。如果都是照搬顶级的解决方案用在自己的企业就不合适。而这些事代表这个广大群体的。
2025-04-10 18:46:42
617
原创 从Oracle和TiDB的HTAP说起
时至今日还是有很多人迷信Hadoop,觉得大数据就是Hadoop。这是不正确的。也难怪这样,很多人OLTP和OLAP也分不清,何况HTAP。
2025-04-07 19:12:51
882
原创 伪需求泛滥时代
父辈比较难以理解为什么这一代尤其是搞IT的怎么就是不能按时下班?以及为什么系统时不时出问题。这些问题今天无法做到一次性说清楚。先开个头吧。
2025-04-01 22:37:02
277
原创 AI加持后能自动化运维吗?
这里要说一下这个社区我也是联合发起人,我发现大家现在都希望听一些日常的问题,而不是歌功颂德的说产品好。我本人多年前参会看到的大厂的经验,开了眼界。不过随着时间长了,我觉得这些要看,但是不能只有这些。阿里、腾讯这样做,我们能用吗?TDSQL打榜1650台机器,Polardb花了20亿做到的极 致,我都承认。只是我用不上。绝大多数用户都不用上。用大家自己企业的那种SQL上去,我个人认为以上的数据库都崩溃,这是我们的常态。所以估计很多人都想开拓眼界的同时看看别人的问题有没有借鉴经验。
2025-03-24 21:59:20
301
原创 数据库从安装到劝退
MySQL被称为5分钟数据库。是形容安装简单。事实也是如此。RPM一下可以就把几个包安装完毕了。一个单机情况下,5分钟是足够的。其他数据库PostgreSQL也差不多是这样。而Redis这种就更快了。所以这些才能流行。曾经数据库中安装相对麻烦一点是Oracle,但是在很多人的努力下也也有了一些一键安装的,我自己也总结了一些使得安装单机都不是太费劲。如今有些国产数据库即使是集群模式也很快安装,比如TiDB、OceanBase等。
2025-03-19 20:34:45
292
原创 保姆级离线TiDB V8+解释
gl=1ujh2l9_gcl_au_ga不过现在这个版本为长期支持版本 (Long-Term Support Release, LTS)那么就不用担心迭代太快的问题了。而且现在的安装应该比较友好(事实也是如此)一天安装了两套总结了一下过程。有些问题(主要是注释)在文档中没有解释,我来解释一下。顺便说一下,我这里是麒麟的操作系统,TiDB这个是适配的。整个过程中没有因为操作系统的问题出现问题。
2025-03-14 21:23:20
625
原创 我有点担心开始AI中台了
从大数据开始就是一窝蜂的去搞,不管有没有什么数据量。反正要来个Hadoop。其实有些企业数据一块硬盘都放得下。微服务来了,也不管自己的系统是不是适合微服务。我个人经验得出,to B和to G的业务场景,长流程的业务场景不适合微服务。也就是to c的互联网场景才可能,注意这里说的是可能也不是一定。中台概念来了,全国建设中台。这个之所以被称为玄学的中台,是因为阿里自己的理解和马老师自己的设想都不一样。然后在全国火热的建设中台时候,阿里就开始拆中台了。
2025-03-10 20:33:34
357
原创 国产免费AI的IDE-TRAE
在上周一次偶然的机会看到了这样的标题–用上Claude的AI编程工具Trae。AI我还没入门,编程也是小白级别。Claude是什么不知道。Trae这是什么也不知道。为什么起这个名字?都不知道含义。先下载吧。(这里要说一下,上周下载的其实是海外版。不能使用AI的部分),直到3月3日的这个才有国内版本。下载以后一步步next就可以了。
2025-03-04 23:05:59
344
原创 个人知识库-腾讯ima
现在不说的deepseek好像就没法和人打招呼了,我爸70多了,都知道这个。然后我儿子也知道。这真的是妇孺皆知、童叟皆知道啊。大家已经知道很多大模型了,文心一言,通义千问,豆包,讯飞,智谱,还有混元以及当红炸子鸡deepseek。国外的就更加不用说了。
2025-03-03 21:39:42
317
原创 IT的寒冬让大家冷静
IT部门在日子好过的时候,可能玩的很花。但是日子不好过的时候,首先是被砍的对象。因为成本部门嘛。群里也好,身边也罢。降薪裁员是去年的主旋律,我相信今年也是,明年还是。
2025-02-19 21:55:42
299
原创 不同人眼中不同的云
去之前,我天真的以为餐饮行业数据不多,毕竟不是所有餐饮都有信息化的诉求。如果有每家都有自己的,也不会太大。再说还有美团、饿了么这些垄断了很多企业。再说了吃一个鸡腿堡,和吃一次西贝价格虽然不一样,但是就是一个支付记录,应该不多吧。我带着这些问题去采访。
2025-02-11 13:26:32
376
原创 DeepSeek、哪吒和数据库:厚积薄发的力量
在这个追求快速迭代、小步快跑的时代,我们似乎总是被 “快” 的节奏裹挟着前进。但当我们静下心来,审视 DeepSeek 的发展、饺子导演创作哪吒系列电影的历程,以及数据库的版本发布,会发现,厚积薄发,往往有着更为震撼人心的力量。
2025-02-05 11:20:50
943
原创 一次StarRocks分析的经历
有人反馈说SR,在系统资源还有空闲的时候,被操作系统杀掉了。没有日志,怀疑是bug,如果要解决这个bug。据说在网上查到要升级。请我准备一下升级。
2025-01-25 16:22:50
933
原创 一次低代码(APEX)的故障处理
又是通过自己摸索的表查到那一天在15点时候有异常。一个小时就快1000次调用了。通过app下的日志也看到了。如果出问题就是那时候。就出现了大量的问题。而这个存储过程是应用开发自定义的。经验又增加了。下次处置会更加准确的定位。
2025-01-24 11:05:41
689
原创 替换数据库不是谁好就用谁
在1.4日的PG上海生态大会上,我发言大致是:每个人都有自己主观意愿。比如MySQL和PG的争论,无论线上还是线下都是难解难分。主观意愿定了,很难改变。即使心里认,但是嘴上也不说。但是如果说到Oracle几乎所有人,都认为从技术、架构、理念和产品等综合来说是当之无愧的第一。而这也是几乎,不能说100%。只是没有其他数据库那么分裂。
2025-01-17 00:10:09
631
原创 有时候处理故障也是玄学
10多天前,表空间满了。无法写入,一直卡着。然后导致了内存和SGA相关问题,然后错误日志一直写,写到磁盘0K。整个过程都是紧急处理,甚至没有细致分析每个环节为什么?事情办的有点粗糙,比如连几十G的错误日志都清理了。但是不清理连命令都打不下去了。然后就是用了玄学的方式得以恢复了。
2025-01-15 18:42:04
724
原创 一周两场技术会议:既是收官也是开端
这个迟来有两个意思,一个是12月28日的活动,我当天只发了朋友圈和视频号没有写感想。我是想和1月4日的活动一起写。第二个意思是好多人已经把1.4日的活动写完了。我才开始。所以总之是晚了。
2025-01-06 00:34:15
246
原创 我的2024年回顾
尽管形式不好,收入下降。但是2024年在以上方面都是我的高光时刻,这算是对自己的安慰。2025砥砺前行,做到和2024年一样的成绩。
2024-12-30 19:41:18
466
原创 AI下程序员和DBA其实也不必迷茫
多年前我和瑞典马工在网上针对这个互相发公众号引发了争论。我们也在直播环节中进行了辩论。如今已经相逢一笑泯恩仇。马工回国在上海逗留的时候我们还一起聚餐。这个问题大家有各自的坚持,而更大的一个问题来了。AI时代下不仅仅是DBA,现在要不要程序员的话题也起来了。这和当年如出一辙,只是比当初的风暴更大了。因为涉及的面更大了,而且是因为现在AI发展的太快了。
2024-12-26 20:31:16
721
原创 全网第一份JSON二元性“写操作”的实践
具体怎么查,官方给出是一个课表之类的用例。但是这个其实让普遍的人认识不深刻。为此我看尹总监写过一篇以订单为用例的建模查询。我是看懂了。不过我不满足于此,我想看看怎么改。
2024-11-26 21:06:56
775
原创 另一个角度的“业务向前,数据库向后”
为了严谨一点我们把业务先分成靠谱的和不靠谱的。很多时候有一句话说技术是为业务服务的,这句听起来政治正确的话,我其实颇有微词。有时候其实业务人员一点都不靠谱。这种时候需要规范一下业务。需求乱提者有之。也有的时候是需求合理的,那么这时候就需要发挥技术人员的能力,尽可能完成业务诉求。我更多的时候能做到的是超过预期。
2024-11-11 22:02:32
395
原创 数据库优化指南:如何将基本功能运用到极致?
数据库的归档日志很多,多到那个机器的硬件不足以处理了。查看了一下为什么产生这么多日志。发现其实都是一些不当的使用方式。比如开发人员建立了一个xxxx_temp从这么名字上就应该能猜出来这是要做什么?美其名曰是临时表。就是导入一批数据,给这些数据做一系列加工(运算),然后再把这些数据删除。用SQL来描述,就是insert 1亿,update 1亿,再delete 1亿。(这里说的1亿是虚数)最终表上是0行数据,但是日志产生了3亿行的操作日志。其实不应该这样用的。如果了解数据库原理就不会这样做。
2024-11-07 21:02:45
319
原创 给cantian建议的第二篇
既然cantian是走存储路线的,这次就从底层的存储这个角度切入。传统数据库架构是存储与计算在一台机器上。这种成为存算一体。那么硬件达到一定程度时候扩展会有点问题。从事数据库相关工作的人都知道,数据库最大的不稳定因素是(低效)SQL,而低效SQL几乎都来自于大量的数据读取。即大量的IO,这里的IO即可能是逻辑IO也可能是物理IO。相对于逻辑IO来说物理IO更为恐怖。所以一般所谓的优化主要工作就是来减少IO。很多时候IO是瓶颈。当然也会遇到优化不动的时候。既然应用侧解决不了,那么就存储侧解决。
2024-11-07 13:58:30
1124
原创 从CAB到PAB Oracle的AI 23.6(之二)
第二天在参会的途中就遇到了公司OGG的延迟问题。通过我快速的判断,我认为应该重启抽取进程。最终我的判断正确,这个问题得以解决。而我也把我的思路发给了昨天官方讲演OGG的老师。他也基本认可我的分析。我个人觉得这些如果能融合到数据库专有大模型的知识库中,数据库在不少场景中就可以免运维了。数据库自动化程度越高,DBA的低级操作也就越少。而可以把有限的精力开从源头开始管理开发和业务。比如故障自愈是可以的,但是也不能一小时自愈一次。DBA要去看看为什么这么频繁的自愈?减少自愈的次数。
2024-11-03 15:28:59
495
原创 从CAB到PAB Oracle的AI 23.6(之一)
这是甲骨文的客户大会Oracle China Customer Advisory Board Metting CAB缩写。和Oracle China Partner Advisory Board Metting PAB缩写。这已经不是我第一次参加了。虽然现在有信创,但是技术人讨论技术还是要纯粹一点。所为纯粹就像精武英雄中 陈真和船越文夫的切磋。而对抗是陈真对藤田刚的对决。
2024-10-31 22:31:39
746
原创 数据库真的是能够决定架构的
从招聘网站中还能看到Java架构师、PHP架构师.NET架构师等等。我不否认每个都有自己的架构,但是我觉得这些都应该是应用架构。我接触到不少架构师是Java出身,然后也懂操作系统,也知道一点数据库,也懂中间件。只是喜欢简单问题复杂化,动不动就是Redis、Mongodb、Kafka、RabbitMQ、NGINX等等。再就是DataX的数据同步。确实全面覆盖了。
2024-10-30 20:36:00
483
原创 数据库中少数民族名字的存储
有人问我他遇到一个问题,就是醒目录入后有乱码的出现。而出现乱码的地方是维族的名字中间的 •。比如迪丽热巴·迪力木拉提。
2024-10-28 20:51:47
299
原创 OceanBase 2024发布会精华盘点,这些亮点不容错过
在月初作为大会观察团的团长,再次领导了任务卡。帮忙联络业内朋友参会。本次邀请的都是第三方代表的个人。都不是OB的用户。最终大家以公众号主理人的身份出现在宣传视频中。而OB另外的宣传报道中也非常注重的将参会嘉宾逐一介绍,而将自己的CTO、CEO、科学家等放置在了海报的最下方。这种姿态受到了大家的好评。
2024-10-24 21:52:05
383
原创 开源的存储引擎--cantian
刚才我们提到说这个产品算存储这边的。不知道的人会问为什么这样算?结合他们在gitee上的描述:Cantian引擎,是一个存储引擎,采用了存算分的离架构,通过分布式缓存技术、事务MVCC机制、多主集群高可用等关键技术,可以让使能普通的单机数据库,让其变得具有类似Oracle RAC的多读多写能力。Cantian引擎无需修改已有数据库的实现,可以以无侵入的方式被MySQL等数据库加载运行。类似Oracle RAC,Cantian引擎的多读多写,也需要基于共享存储来构建。
2024-10-19 19:32:20
1013
原创 从误删文件说说数据库的DRA
各种数据库都有对误删除文件都有一定的处理方式。今天说说Oracle的DRA。这个不是新技术,但是其实知道的人我估计不多。当年是考OCP的时候学习到的。那时候是11G,这个版本是2007年发布的。所以说不是新东西。但是即使这是OCP中必考的,但依然很多人不知道。说句实话我也是在考试中学习,生产环境中没有用过。就像一般的备份,大家也几乎很少用到一样。只能说运气好,工作以来从来没让我去用备份恢复过生产。而这个DRA技术也是一直停留在实验环境中。在有备份的前提下,把系统的文件删除了。从图中看到,被恶意删除了sysa
2024-10-13 21:54:11
503
原创 让DBA来管理开发对不对?
27个大的列表,不断的写入和读出。你可以理解为一个消息队列。虽然说Redis支持消息队列的这种应用。这个我在第一本书中介绍过。但是吧。支持也有个前提条件。毕竟不能当做kafka用。就像数据库的多模是可以解决异构数据库的融合,但是极致的应用的话,还是差点意思。这就像不少数据库说兼容谁谁谁。但是如果是深度应用的话,还是不行。这种深度不是说使用了存储过程就是深度。10行的存储过程,那叫兼容。10万行的存储过程,那叫深度应用。所以我一般和人交流,有的企业说我们已经不让用存储过程了。
2024-10-08 22:45:09
415
Pulsar问题无法调用SQL命令
2021-08-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人