性能测试常见问题-优快云博客

性能测试 (Performance Testing)
广义概念，指评估系统在特定条件下的响应速度、稳定性和资源消耗的测试活动。包含负载测试、压力测试等子类。
负载测试 (Load Testing)
模拟预期生产环境并发用户量，验证系统能否处理正常业务压力，关注性能指标是否达标（如响应时间≤2秒）。
压力测试 (Stress Testing)
逐步增加负载超过系统设计容量（如200%并发用户），探测系统极限和失效点，观察资源耗尽时的表现（如内存泄漏、服务雪崩）。

区别对比

测试类型	目标	负载水平	关注重点
性能测试	综合评估系统能力	多场景覆盖	整体性能基线
负载测试	验证生产环境容量	设计峰值压力	稳定性与SLA达标
压力测试	探测系统极限和失效模式	超设计极限负载	故障恢复与降级策略

核心性能指标

指标	说明	行业参考标准
响应时间	请求发出到接收到响应的时间（网络+服务处理+渲染）	API≤500ms, 页面≤3s
并发用户数	同时向系统发起请求的用户数（注意区分业务并发与技术并发）	根据业务模型测算
TPS/QPS	每秒处理事务数（业务维度）/ 每秒查询数（技术维度）	金融系统通常≥1000 TPS
吞吐量(Throughput)	系统单位时间内处理的数据量（MB/s）或请求量	受网络带宽和服务器限制
错误率	失败请求占比（HTTP 5xx/超时/业务逻辑错误）	≤0.1% （关键系统≤0.01%）
资源利用率	CPU（≤70%安全线）、内存（警惕泄漏）、磁盘I/O（读写延迟）、网络带宽（饱和度）	云环境需关注容器配额

graph TD
A[需求分析] --> B[场景设计]
B --> C[脚本录制与增强]
C --> D[压测执行]
D --> E[监控与数据采集]
E --> F[瓶颈定位与调优]
F --> G{是否达标？}
G -->|否| B
G -->|是| H[输出报告]

阶段详解：

graph LR
A[高错误率] --> B[查日志定位超时点]
B --> C{数据库慢SQL？}
C -->|是| D[SQL优化+索引调整]
C -->|否| E[检查线程阻塞]
E --> F[JVM线程堆栈分析]

工具	适用场景	优势	局限
JMeter	Web/API压测、开源定制化	插件生态丰富（Kafka/JDBC支持）	高并发下资源消耗较大
LoadRunner	企业级复杂场景（含SAP/Oracle协议）	强大的事务分析器、IP欺骗功能	商业许可昂贵
Gatling	高并发低资源消耗场景	基于Scala的高性能引擎、实时报告	DSL脚本需要学习成本
Locust	分布式压测+代码驱动场景	Python脚本灵活扩展	监控能力较弱
k6	云原生/DevOps集成	支持JavaScript、与CI/CD无缝集成	社区版功能有限

选型建议：

分层排查框架：

典型案例：

方法论：分层定位 + 工具链组合

# 监控方法调用耗时
trace com.example.service.OrderService createOrder
# 查看线程阻塞原因
thread -b

SHOW PROCESSLIST;-- 查看阻塞会话
SELECT * FROM sys.schema_table_lock_waits; -- 8.0+锁等待查询

perf record -F 99 -g -p [pid] -- sleep 30
perf script | FlameGraph/stackcollapse-perf.pl | FlameGraph/flamegraph.pl > cpu.svg

调优闭环：

通过监控发现CPU飙升 → 2. Arthas定位到频繁Full GC → 3. MAT分析发现大对象缓存未释放 → 4. 修复代码增加缓存淘汰策略 → 5. 重新压测验证

性能测试是系统工程，需掌握：