哔哩哔哩评论系统架构

Charles_go

已于 2024-12-14 14:16:39 修改

阅读量1k

点赞数 10

文章标签：系统架构

于 2024-12-14 14:15:19 首次发布

本文链接：https://blog.youkuaiyun.com/m0_52276169/article/details/144470333

版权

来源哔哩哔哩技术公众号。

发评论：
- 用户通过 reply-interface 发送评论。
- 评论数据通过消息队列（MQ）传递到 reply-job。
- reply-job 处理评论数据，并将其批量处理（batch processor）后写入 TiDB Cluster。
TiDB Cluster：
- 评论数据被存储在 TiDB Cluster 中的多个表中：
  - subject 表：存储评论的主题信息。
  - reply 表：存储评论的基本信息。
  - content 表：存储评论的具体内容。
- TiDB Cluster 通过 binlog 同步数据到其他存储系统。

读评论：
- 用户请求读取评论。
- 请求首先访问 Redis Cluster 中的缓存数据。
- 如果缓存命中，则直接返回结果。
- 如果缓存未命中，则通过 SQL 查询 TiDB Cluster 或 NoSQL 数据库（如 Taishan Cluster）获取数据，并更新缓存。
Redis Cluster：
- 评论区（subject）、评论物料（reply）和排序索引（sorted set）存储在 Redis Cluster 中。
- Redis 用于快速读取和缓存数据，提高响应速度。

TiDB Cluster 一级存储：
- TiDB Cluster 作为一级存储，存储评论的原始数据。
- 通过 binlog 同步数据到二级存储系统。
Taishan Cluster 二级存储：
- 二级存储系统（Taishan Cluster）存储评论的详细信息和排序索引。
- 包括评论主题、评论内容、根评论、子评论、热度序、点赞序、时间序等。
对账系统：
- 对账系统包括实时对账和离线对账。
- 实时对账和离线对账分别使用 TiDB Hive 和 Taishan Hive 进行数据处理和校验。

流量控制：
- 通过优先级、路由规则、控制策略和自动降级等机制来控制流量。
- 优先级：确保高优先级的请求优先处理。
- 路由规则：根据规则将请求路由到合适的处理节点。
- 控制策略：限制请求的并发数，防止系统过载。
- 自动降级：在系统压力过大时，自动降级部分非关键功能，保证核心功能的正常运行。