
系统运维
文章平均质量分 92
去哪儿网技术沙龙
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
全方位解读 MySQL 日志实现内幕(五)
`王竹峰去哪儿网数据库专家,擅长数据库开发、数据库管理及维护,一直致力于 MySQL 数据库源码的研究与探索,对数据库原理及实现具有深刻的理解。曾就职于达梦数据库,多年从事数据库内核开发的工作,后转战人人网,任职高级数据库工程师,目前在去哪儿网负责 MySQL 源码研究与运维、数据库管理和自动化运维平台设计开发及实践工作,是 Inception 开源项目及《MySQL 运维内参》的作者,也是 Oracle MySQL ACE。本文作者将出版于《MySQL 运维内参》中部分内容进行分享,通过多篇.原创 2021-08-26 18:15:39 · 249 阅读 · 0 评论 -
全方位解读 MySQL 日志实现内幕(四)
`王竹峰去哪儿网数据库专家,擅长数据库开发、数据库管理及维护,一直致力于 MySQL 数据库源码的研究与探索,对数据库原理及实现具有深刻的理解。曾就职于达梦数据库,多年从事数据库内核开发的工作,后转战人人网,任职高级数据库工程师,目前在去哪儿网负责 MySQL 源码研究与运维、数据库管理和自动化运维平台设计开发及实践工作,是 Inception 开源项目及《MySQL 运维内参》的作者,也是 Oracle MySQL ACE。本文作者将出版于《MySQL 运维内参》中部分内容进行分享,通过多篇.原创 2021-08-26 17:14:25 · 283 阅读 · 0 评论 -
全方位解读 MySQL 日志实现内幕(三)
王竹峰去哪儿网数据库专家,擅长数据库开发、数据库管理及维护,一直致力于 MySQL 数据库源码的研究与探索,对数据库原理及实现具有深刻的理解。曾就职于达梦数据库,多年从事数据库内核开发的工作,后转战人人网,任职高级数据库工程师,目前在去哪儿网负责 MySQL 源码研究与运维、数据库管理和自动化运维平台设计开发及实践工作,是 Inception 开源项目及《MySQL 运维内参》的作者,也是 Oracle MySQL ACE。本文作者将出版于《MySQL 运维内参》中部分内容进行分享,通过多篇文..原创 2021-08-26 16:26:43 · 604 阅读 · 0 评论 -
全方位解读 MySQL 日志实现内幕(二)
`王竹峰去哪儿网数据库专家,擅长数据库开发、数据库管理及维护,一直致力于 MySQL 数据库源码的研究与探索,对数据库原理及实现具有深刻的理解。曾就职于达梦数据库,多年从事数据库内核开发的工作,后转战人人网,任职高级数据库工程师,目前在去哪儿网负责 MySQL 源码研究与运维、数据库管理和自动化运维平台设计开发及实践工作,是 Inception 开源项目及《MySQL 运维内参》的作者,也是 Oracle MySQL ACE。本文作者将出版于《MySQL 运维内参》中部分内容进行分享,通过多篇.原创 2021-08-25 11:14:36 · 278 阅读 · 0 评论 -
全方位解读 MySQL 日志实现内幕(一)
`王竹峰去哪儿网数据库专家,擅长数据库开发、数据库管理及维护,一直致力于 MySQL 数据库源码的研究与探索,对数据库原理及实现具有深刻的理解。曾就职于达梦数据库,多年从事数据库内核开发的工作,后转战人人网,任职高级数据库工程师,目前在去哪儿网负责 MySQL 源码研究与运维、数据库管理和自动化运维平台设计开发及实践工作,是 Inception 开源项目及《MySQL 运维内参》的作者,也是 Oracle MySQL ACE。本文作者将出版于《MySQL 运维内参》中部分内容进行分享,通过多篇.原创 2021-08-25 10:51:57 · 244 阅读 · 0 评论 -
国内酒店稳定性治理实践之缓存治理
`郑吉敏2019 年 8 月加入国内酒店报价中心团队,主要负责报价相关系统开发及架构优化。对高并发高可用有浓厚兴趣,有日订单千万分布式系统高可用建设经验。喜欢钻研算法,acmicpc 程序设计大赛两次进入亚洲区预选赛。曾在 Qunar 首届 Hackathon 大赛中获得一等奖。背景2019 年 9 月,我们连续遇到几次与缓存相关的故障:1、DBA 运维失误,导致我们存储在 redis 里的核心基础数据被清空。由于无法正常提供报价,出现 ATP(订单量骤降)故障,之后通过定时任务花费半个小.原创 2021-08-24 10:49:05 · 265 阅读 · 0 评论 -
国内酒店稳定性治理实践之内部资源治理
郑吉敏2019 年 8 月加入国内酒店报价中心团队,主要负责报价相关系统开发及架构优化。对高并发高可用有浓厚兴趣,有日订单千万分布式系统高可用建设经验。喜欢钻研算法,acmicpc 程序设计大赛两次进入亚洲区预选赛。曾在 Qunar 首届 Hackathon 大赛中获得一等奖。背景之前介绍了国内酒店稳定性治理实践之系统间依赖治理,我们对系统间的依赖进行了专项治理,涉及通用的限流、缓存、Dubbo、Http、DB、MQ 等。但是光治理系统间的依赖是不够的,我们还对系统内部资源进行了分析和治理。..原创 2021-08-23 17:41:11 · 314 阅读 · 0 评论 -
Qunar 是如何解决 IDC 网络故障自愈问题的
苗宏涛2010年加入Qunar,目前负责技术保障部运维管理工作,先后带领团队完成DNS系统,负载均衡系统和运维自动化体系,分布式存储系统的规划和建设工作。1、背景介绍我在2010年加入 Qunar 的时候,Qunar 的 IDC 规模还比较小,服务器也只有几百台。随着公司的发展,业务对服务器的需求也越来越大,随之 Qunar 的 IDC 规模也逐渐壮大起来。如果将所有服务器放到一个 IDC 中,虽然管理会简单一些,但是带来的风险也是不可避免的。单个机房出现故障的风险还是存在的,比如电力、网络..原创 2021-08-17 15:06:07 · 444 阅读 · 0 评论 -
防火墙 Keepalived 异常双活恢复后部分外网访问中断问题分析
冯亚伟(去哪儿网 NETOPS)2014年7月加入去哪儿网,拥有丰富的网络运维经验,现负责公司IDC和骨干传输网络的运维工作。1. 故障描述1、19:01 在 fw4 仍然为 master 的状态下 fw3 独自提升为 master 状态;2、19:27 fw3 独自放弃 master 状态,故障开始;3、19:44 发现机器 server1 请求外部接口异常;4、19:48 清理机器 server1 上的 arp 缓存,机器恢复;5、19:51 在 fw4 上发送 vip 的免费 a...原创 2021-08-04 16:14:52 · 809 阅读 · 0 评论 -
PostgreSQL 中如何控制行级安全和列级安全
彭占元2018年8月加入去哪儿网,现负责公司 PostgreSQL/GreenPlum 运维工作,对数据库日常运维和日常调优有大量优化实践经验。1. 需求提出最近有业务线的同学向 DBA 提出这样的需求:“我的表里有很多敏感数据,怎么给使用者(从 DBA 角度来看就是 DB User)指定查看某些特定行或某些列的权限?”这是我们经常用到的业务场景,比如最典型全公司的短信数据和用户管理平台场景,如何限制各部门仅可查看属于本部门的某些非敏感数据?PostgreSQL 为了符合各种场景的安全需...原创 2021-08-03 10:42:10 · 600 阅读 · 0 评论 -
Cisco VPC peer-gateway 对直连 BFD 邻居建立的影响
作者简介:冯亚伟,去哪儿网 NETOPS,2014 年 7 月加入去哪儿网,拥有丰富的网络运维经验,现负责公司 IDC和骨干传输网络的运维工作。一、场景介绍如下图所示:两台思科 nexus 交 换机通过 VPC 为服务器提供双上联接入;服务器通过 bond0(主备模式)双上联到两台交换机上面。连接 SW1 的网卡为主用网卡,连接 SW2 的网卡为备用网卡;服务器作为 k8s 节点需要与两台接入交换机建立 iBGP ,为了缩短 BGP 的收敛时间用单跳 BFD 进行链路故障检测。两台接入交换机使用 i.原创 2021-07-02 16:36:50 · 1002 阅读 · 0 评论 -
Qunar DNS 体系建设
作者简介:苗宏涛,2010 年加入去哪儿,主要负责去哪儿网站运营-技术保障部相关工作。将运维自动化,智能化一直是我秉持的理念。DNS定义DNS 是域名系统 ( Domain Name System ) 的缩写,是因特网的一项核心服务,它作为可以将域名和 IP 地址相互映射的一个分布式数据库,能够使人更方便的访问互联网,而不用去记住能够被机器直接读取的 IP 数字串。互联网能够互联互通,能够方便人们方便访问,DNS 起到了很大的作用。DNS 查询过程要维护好 DNS 系统,首先要理解 DNS 的原理.原创 2021-07-02 15:25:50 · 214 阅读 · 0 评论 -
浅析 Redis 分布式锁解决方案
1 背景我们日常在电商网站购物时经常会遇到一些高并发的场景,例如电商 App 上经常出现的秒杀活动、限量优惠券抢购,还有我们去哪儿网的火车票抢票系统等,这些场景有一个共同特点就是访问量激增,虽然在系统设计时会通过限流、异步、排队等方式优化,但整体的并发还是平时的数倍以上,为了避免并发问题,防止库存超卖,给用户提供一个良好的购物体验,这些系统中都会用到锁的机制。对于单进程的并发场景,可以使用编程语言及相应的类库提供的锁,如 Java 中的 synchronized 语法以及 ReentrantLock 类原创 2021-02-03 15:19:56 · 362 阅读 · 0 评论 -
记一次 PXC 集群拆分引发的思考
1 内容摘要众所周知,MySQL 基于 GTID 复制功能的出现,极大地简化了 MySQL 复制拓扑初始化配置和变更以及高可用的切换。在去哪儿网,我们大量使用 PXC(Percona XtraDB Cluster)集群,然而 PXC 中用于记录事务的 Galera GTID 与普通的 MySQL GTID 还是有一点差异,运维过程中如果不加注意,可能会引发一些问题。本文通过记录一次 PXC 集群拆分的过程中由于未深刻理解这两者的差别而导致的问题与原因分析,总结了 Galera GTID 与 MySQL G原创 2021-02-03 11:32:29 · 248 阅读 · 0 评论