✅ 一、常用技术/运营指标整理(通俗解释 + 面试用法)
| 缩写 | 全称 | 通俗解释 | 常见用途 | 面试答法示例 |
|---|---|---|---|---|
| QPS | Queries Per Second | 每秒处理的请求数量(接口调用量) | 衡量系统吞吐能力 | 系统接口 QPS 峰值 3000,设置 Sentinel QPS 限流阈值保护系统 |
| TPS | Transactions Per Second | 每秒事务处理数(数据库/业务成功交易) | 衡量系统业务处理能力 | 数据库 TPS 峰值 800,需确保连接池/写入能力不成为瓶颈 |
| RT | Response Time | 响应时间,单位:毫秒 ms | 衡量接口快慢/用户体验 | 核心接口 P99 响应时间控制在 200ms 内 |
| DAU | Daily Active Users | 每天活跃用户数 | 衡量用户活跃度 | 系统 DAU 10万,接口需承受高并发流量,QPS 峰值 1500 |
| MAU | Monthly Active Users | 每月活跃用户数 | 用户粘性评估 | 新功能上线后 MAU 提升了 30% |
| PV | Page Views | 页面浏览数(访问量) | 常用于前端页面统计 | 某活动页 PV 超过 50w,需要 CDN 缓存防止刷流量 |
| UV | Unique Visitors | 独立访客数(按用户ID/IP 统计) | 粗略衡量用户规模 | 活动日 UV 峰值 20w,配合限流防护服务稳定性 |
| P99 | Percentile 99 | 表示 99% 的请求响应时间低于该值 | 衡量响应性能 | 接口 P99 为 180ms,说明极端慢请求较少 |
| RPS | Requests Per Second(≈ QPS) | 每秒请求数(更偏向 HTTP 层) | Web 服务器负载能力 | Nginx 入口 RPS 峰值 5000,需做负载均衡 |
| 容量指标 | 系统能处理的最大并发/请求数 | 系统承压能力 | 压测评估 | 单节点支持 2000 QPS,集群部署 5 台,总容量 1w QPS |
✅ 一、基础理解类(定义解释)
1️⃣ Q:什么是 QPS、TPS,它们有何区别?
-
✅ 答题要点:
-
QPS 是每秒接口请求次数,关注“调用”。
-
TPS 是每秒完成的事务数,关注“成功业务”。
-
QPS ≥ TPS,一般 TPS 更能反映业务处理能力。
-
举例:接口被刷可能 QPS 很高,但 TPS 没变化。
-
2️⃣ Q:什么是 DAU?UV 和 PV 有什么区别?
-
✅ 答题要点:
-
DAU:每天活跃用户数量(业务常用)。
-
PV:页面访问量(一个用户访问多次会重复计)。
-
UV:独立访客数(一个用户一天只算一次)。
-
实战:UV、PV 用于评估系统压力,DAU 用于评估用户增长和活跃度。
-
✅ 二、实战应用类(项目经验)
3️⃣ Q:如果你的系统日活(DAU)是 10 万,你如何评估系统的 QPS 和 TPS?
-
✅ 答题要点:
-
先用流量估算公式:
总QPS ≈ DAU × 日均访问次数 ÷ 在线秒数 -
例:DAU 10w × 20 次 ÷ 12 小时 ≈ 46 QPS
-
TPS = QPS × 成功率(一般小于 QPS)
-
然后以此做压测 + 配置限流阈值
-
4️⃣ Q:你在项目中怎么设置 Sentinel 的限流阈值?
-
✅ 答题要点:
-
根据历史 QPS 峰值 × 安全系数(比如 0.8)设置
-
热点参数限流用于控制某些 ID 被频繁访问
-
高并发时配合 WarmUp、匀速排队等方式防止突刺
-
示例:QPS 1000 峰值 → 设置限流 800,保护系统
-
5️⃣ Q:如果你要监控某个系统的响应性能指标,你会重点看哪些?
-
✅ 答题要点:
-
QPS / TPS:衡量吞吐量
-
RT(响应时间):衡量性能
-
P99:判断尾部响应慢的情况
-
错误率 / 限流率:观察异常波动
-
配合 Dashboard 或日志平台实时观测
-
✅ 三、深入思考类(架构能力)
6️⃣ Q:如果一个接口 QPS 暴涨,你会怎么做限流保护?
-
✅ 答题要点:
-
先分析原因:刷接口 / 热点资源 / 真实大促?
-
使用 Sentinel 进行 QPS 限流、参数限流
-
降级非核心逻辑(如推荐、日志)
-
热点缓存 + 队列削峰 + fallback 页面兜底
-
7️⃣ Q:什么是 P99?它在实际监控中如何使用?
-
✅ 答题要点:
-
P99 表示 99% 的请求在这个时间内完成
-
用来衡量系统“极端情况”的响应性能
-
比平均值更真实反映用户体验
-
示例:平均响应 100ms,P99 却是 2s,说明尾部请求较慢
-
8️⃣ Q:你如何评估一个系统的最大吞吐能力(容量)?
-
✅ 答题要点:
-
压测(如 JMeter)找出极限 QPS、TPS
-
根据硬件配置、线程池、数据库连接池瓶颈综合分析
-
用 QPS × RT × 并发连接数 来估算处理能力
-
Sentinel 可结合集群限流保证整体负载不超标
-
✅ 面试答题时可以这样说:
我们服务日活(DAU)在 10w 左右,日均 PV 达 50w,接口平均 QPS 在 800~1500 区间,峰值可达 2500。针对这些指标,我们在入口设置了 Sentinel 限流 + 熔断策略,配合缓存和异步队列提升系统吞吐。同时配合压测工具预估系统 TPS 与最大并发,确保发布后系统稳定。
✅ 技术对话中常见的解释口吻:
-
“我们这个接口日常 QPS 在 1000 左右,双十一会飙升到 8000,所以我们做了限流和缓存预热”
-
“系统 TPS 不高,但 RT 要求很低,核心接口响应时间需控制在 100ms 内”
-
“页面 PV 虽高,但 UV 实际并不多,刷量可能性较大”
-
“我们通过压测工具 JMeter 发现系统瓶颈在数据库 TPS 上限,考虑加 Redis 缓存降压”
995

被折叠的 条评论
为什么被折叠?



