为什么生产环境会跑得比测试环境还慢

最新推荐文章于 2022-07-18 11:56:51 发布

ciwan8376

最新推荐文章于 2022-07-18 11:56:51 发布

阅读量282

点赞数

文章标签：数据库

http://blogs.msdn.com/b/apgcdsd/archive/2011/09/20/10213797.aspx[@more@]

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/66009/viewspace-1057108/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/66009/viewspace-1057108/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ciwan8376

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

MYSQL——真实生产环境的数据库机器配置

庄小焱

01-19

3068

摘要介绍真实项目中数据库配置选型，帮助构建MYSQL集群，承载数据库的的存储与查询工作。一、生产环境机器配置经验值 Java应用系统部署的时候常选用的机器配置大致是2核4G和4核8G的较多一些 数据库部署的时候常选用的机器配置最低在8核16G以上，正常在16核32G。一般Java应用系统部署在4核8G的机器上，每秒钟抗下500左右的并发访问量，差不多是比较合适的，当然这个也不一定。一台机器能抗下每秒多少请求，往往是跟你每个请求处理耗费多长时间是关联的。大体上来说，根据我们大量的经验观察而言，

生产环境开发踩过的坑～

xljiayou_的博客

03-31

3058

记录一些开发中踩过的坑～ 2020.03.31 不能拉取test分支合并到自己分支只能将代码往test分支合，不能将test分支合并到自己分支，否则会污染自己分支，导致报废。应该将自己代码合并到test分支，在测试环境通过后，将自己分支合并到master，可以拉去master分支到自己分支。 2020.03.31 微服务是无状态的直播截图。我在这块最开始的思路是直播回调接口后，开一个协程去定...

参与评论您还未登录，请先登录后发表或查看评论

maven 为测试环境、生产环境等不同环境打包

日拱一卒，功不唐捐

02-23

980

maven 为测试环境、生产环境等不同环境打包

生产环境服务器变慢问题分析

Conrad21CT的博客

07-18

887

生产环境服务器变慢问题从CPU利用率、磁盘IO效率以及内存GC等方面分析

一次测试环境运行正常，而生产环境运行失败的问题排查

wang_quan_li的专栏

03-18

5535

具体操作是通过界面删除一条数据，测试环境可以删除，而生产环境删除不了因为程序是api和client分开的，我告诉开发直接调用生产环境的api看是否能删除，结果删除不了一会开发告诉我问题找到了，原因是生产数据库缺少测试数据库的一个字段，那么问题来了，以后遇到类似问题，排查到是api的问题后，应该先从最底层开始比对，比如生产数据库和测试数据库是否一致其次，搭建一个准生产环境也显得很有必

Vue 移动端项目生产环境的优化

热门推荐

技术杂谈

11-17

2万+

本文来自作者一米阳光在 GitChat 上分享「Vue 移动端项目生产环境的优化」，「阅读原文」查看交流实录「文末高能」编辑 | 嘉仔讲解之前，咱们接地气的描述一下单页面应用程序。所谓单页面应用程序，其实就是只有一个页面，这个页面中有一个div，而后的页面，我们称为模板（或者组件），在切换页面的时候，改变这个div中的模板（或者组件）即实现的单页面应用程序。

软件测试知识概括

weixin_41005188的博客

06-01

5287

软件测试知识概括软件测试基础软件测试详解软件测试拓展Fiddler抓包工具总结Jmeter(压力测试工具) 软件测试基础什么是软件：软件是计算机程序、程序所用的数据以及有关文档资料的集合。软件是计算机的灵魂。软件又可以分为两大类:系统软件和应用软件。系统软件:系统软件是生成、准备和执行其他程序所需要的一组文件和程序。如操作系统Windows，数据库SQL-Server,驱动程序(网卡，声卡)，java语言系统编译环境等。应用软件:计算机用户为了解决某些具体问题而购买、开发或研制的各种程序或软件包

【QCAT性能优化全解析】：如何让自动化测试跑得更快更稳

此外，本文还探讨了QCAT自动化测试优化实践，涵盖测试脚本、数据管理以及测试执行策略的优化。最后，文章着眼于性能优化的高级应用，如负载测试、压力测试以及持续性能监控与改进，提供实际案例分析以展示性能优化的...

GItLab入门级CI/CD环境搭建（适用于小微企业或个人）

Baldwin_KeepMind

04-05

1405

测试环境中常见问题

小小软测师的博客

01-03

2471

1.端口号被占：在启动多个项目服务时，可能遇到端口号被占用的情况，这时我们就需要到server.xml来修改端口号，大概在70行的位置进行修改，端口号不重复。 2.端口号被防火墙拦截：可以关闭防火墙或开放端口号根据服务器的版本不同使用的指令会有所区别：cat /etc/redhat-release 7.0以下的服务器： service iptables stop #关闭防火墙 servic...

Mysql本地执行快，测试也快，生产贼慢(已解决)

weixin_43555115的博客

01-11

4409

引出问题一个很简单的sql，生产环境查询竟然要这么久我本地只需要0.2s,测试环境也只需要不到1秒钟。这差距也太大了。执行的sql如下： select date_day,detain_flag,reserve_flag,into_type,out_type,usable_flag from table where line_no='11' and date_day BETWEEN '2021-01' nd '2022-02' and is_del=0 AND type=1 ; 前置说明：

生产环境、开发环境、测试环境

kuangruike的博客

03-15

1115

开发环境：开发环境是程序猿们专门用于开发的服务器，配置可以比较随意，为了开发调试方便，一般打开全部错误报告。 测试环境：一般是克隆一份生产环境的配置，一个程序在测试环境工作不正常，那么肯定不能把它发布到生产机上。生产环境：是值正式提供对外服务的，一般会关掉错误报告，打开错误日志。三个环境也可以说是系统开发的三个阶段：开发->测试->上线，其中生产环境也就是通常说

测试必知——开发、测试、生产环境的区别

qq_38925100的博客

07-03

4638

一、背景：软件开发环境(Software Development Environment，SDE)是指在基本硬件和宿主软件的基础上，为支持系统软件和应用软件的工程化开发和维护而使用的一组软件，简称SDE。它由软件工具和环境集成机制构成，前者用以支持软件开发的相关过程、活动和任务，后者为工具集成和软件的开发、维护及管理提供统一的支持。二、项目部署环境一般可分为三种：生产环境，测试环境，开发环境 ...

对与程序员来说，生产环境和开发环境要注意的

qq_28929589的博客

06-08

2346

1. 在开发过程中有时候会有历史数据产生，我建议不要用生产环境的数据库，然后本地复制数据库信息，利用本地的开发环境进行数据的生产。2. 所以我们在处理数据的时候要区分生产就是生产，开发就是开发，不要把开发时的数据给生产。...

测试环境运行正常的SQL到生产上奇慢无比，最终导致UI访问超时；确定SQL效率无问题，那么就极有可能使生产环境的表数据量较大而且没有做分析。

qihezhiye03的专栏

07-25

1524

如题

Web前端性能优化经验分享

ql9075的博客

05-10

1463

1.请减少HTTP请求基本原理：在浏览器(客户端)和服务器发生通信时，就已经消耗了大量的时间，尤其是在网络情况比较糟糕的时候，这个问题尤其的突出。一个正常HTTP请求的流程简述：如在浏览器中输入"www.xxxxxx.com"并按下回车，浏览器再与这个URL指向的服务器建立连接，然后浏览器才能向服务器发送请求信息，服务器在接受到请求的信息后再返回相应的信息，浏览器接收到来自...

UAT环境正常,上线生产环境后访问不到数据的原因分析及问题解决

weixin_38256991的博客

12-27

4320

本人研发小白一名，时间：2017年12月21(周四)，坐标：上海。项目上线，测试环境正常，上UAT环境后访问不到数据，于是开始步步分析，细细琢磨，最终成功上UAT，但影响了上生产环境的时间，造成项目延时发布，第一次遇到这么奇怪的事情，之后就是2017年12月26(周二)的上生产环境，不过可怕的事情还是发生了：本地、测试、UAT环境都正常，生产环境有访问不到数据，直到12月27号2：00才解决，...

java jar包跑一段时间cup到200%会是什么问题

最新发布

04-04

<think>嗯，用户问的是Java的jar包运行一段时间后CPU占用率达到200%可能是什么问题。首先，我需要确认用户的使用场景。通常，CPU占用率高可能出现在服务器应用或者长时间运行的后台服务中。用户提到的是jar包，所以很可能是基于Spring Boot或者其他框架打包的应用。接下来，我得考虑可能的原因。CPU使用率高通常与线程频繁执行计算密集型操作、死循环、锁竞争、频繁GC或者代码逻辑问题有关。用户提到的是运行一段时间后出现，所以可能不是启动时的问题，而是随着时间累积出现的，比如内存泄漏导致GC频繁，或者某个定时任务出了问题。用户可能是在生产环境遇到这个问题，需要快速定位和解决。他们可能没有详细的监控工具，所以需要一些基本的排查步骤，比如使用top命令查看进程，jstack获取线程转储，或者jstat查看GC情况。另外，用户可能对Java内部机制不是很熟悉，所以需要用简单易懂的语言解释可能的原因，并提供具体的解决步骤。比如，如何检查线程状态，如何分析GC日志，或者如何优化代码。还需要注意，CPU使用率200%意味着在多核系统上，两个核心被完全占用，这通常是因为有多个线程在并行执行高负载任务。可能的原因包括线程池配置不当，导致创建过多线程，或者某个循环没有正确的退出条件。用户可能没有提到日志信息，所以需要建议他们检查应用日志，看是否有异常或错误信息。同时，也要考虑外部依赖，比如数据库查询变慢，导致线程阻塞，进而引起CPU飙升。最后，需要给出一个结构化的回答，分点列出可能的原因和解决方法，帮助用户逐步排查问题。可能还需要推荐一些工具，比如Arthas，来帮助诊断问题。</think>--- ### **1. 问题本质** Java进程的CPU占用率达到**200%**（在多核系统中，表示两个CPU核心被完全占用），通常由以下原因导致： - **线程密集计算**：代码中存在死循环、未优化的算法或高并发计算任务。 - **资源争用**：线程锁竞争（如`synchronized`、`ReentrantLock`）导致线程频繁阻塞和唤醒。 - **垃圾回收（GC）频繁**：内存泄漏或堆配置不当引发频繁Full GC，消耗CPU资源。 - **外部依赖阻塞**：如慢SQL查询、网络IO阻塞导致线程池资源耗尽。 - **框架或库的Bug**：第三方库（如Spring、Netty）的异常行为导致CPU空转。 --- ### **2. 排查步骤** #### **步骤1：定位高CPU线程** 1. **查看进程CPU占用**： ```bash top -H -p <java_pid> # 查看线程级别的CPU占用（Linux） ``` - 记录占用最高的线程ID（十进制转十六进制，用于后续分析）。 2. **生成线程快照**： ```bash jstack <java_pid> > thread_dump.txt # 输出线程堆栈 ``` - 在`thread_dump.txt`中搜索对应线程的十六进制ID（如`nid=0x3e7`），分析其堆栈信息。 #### **步骤2：常见问题模式分析** - **死循环/密集计算**： - 线程堆栈中显示长时间停留在同一方法（如`while(true)`、复杂数学运算）。 - **锁竞争**： - 多个线程状态为`BLOCKED`，且等待同一锁（如`synchronized`代码块）。 - **GC频繁**： - 使用`jstat`监控GC情况： ```bash jstat -gcutil <java_pid> 1000 # 每秒输出GC统计 ``` - 若`FGC`（Full GC次数）持续增长且`FGCT`（Full GC时间）显著，可能存在内存泄漏。 #### **步骤3：代码与依赖检查** - **检查高并发代码**： - 线程池配置是否合理（如核心线程数过大）。 - 是否存在未优化的循环或递归调用。 - **外部依赖分析**： - 数据库慢查询、Redis大Key、HTTP接口超时等可能导致线程阻塞。 - 使用`jstack`观察线程状态是否为`RUNNABLE`（CPU占用）或`WAITING`（IO阻塞）。 --- ### **3. 常见原因与解决方案** #### **(1) 代码死循环或密集计算** - **示例场景**： ```java // 错误示例：未设置退出条件的循环 while (true) { // 密集计算（如未批处理的流处理） } ``` - **解决**： - 优化算法复杂度（如减少嵌套循环）。 - 添加合理的退出条件或休眠（如`Thread.sleep()`）。 #### **(2) 线程锁竞争** - **示例场景**： ```java // 错误示例：粗粒度锁导致并发性能差 public synchronized void process() { // 耗时操作 } ``` - **解决**： - 缩小锁范围（如使用细粒度锁或`ConcurrentHashMap`）。 - 替换为无锁数据结构（如`AtomicInteger`）或读写锁（`ReentrantReadWriteLock`）。 #### **(3) 频繁垃圾回收（GC）** - **现象**： - `jstat`显示`FGC`频繁增长，`OU`（老年代使用量）接近100%。 - 日志中频繁出现`Full GC`。 - **解决**： - 分析堆转储（`jmap -dump:format=b,file=heap.hprof <pid>`），用MAT工具查找内存泄漏。 - 调整堆大小（如`-Xmx4g -Xms4g`）或选择更适合的GC算法（如G1）。 #### **(4) 框架或库的异常行为** - **典型问题**： - Spring Boot Actuator端点被频繁调用。 - Netty的EventLoop线程因任务堆积导致CPU满载。 - **解决**： - 检查框架配置（如Actuator的安全限制）。 - 使用`AsyncProfiler`或`Arthas`分析热点方法。 #### **(5) 外部依赖阻塞** - **示例场景**： - 数据库查询未加索引，导致单次查询耗时过长。 - HTTP客户端未设置超时，线程池被占满。 - **解决**： - 优化SQL（添加索引、分页查询）。 - 为外部调用设置超时（如`Feign.client.config.default.readTimeout=5000`）。 --- ### **4. 工具推荐** 1. **Arthas**： - 动态跟踪Java方法调用，定位CPU热点： ```bash trace com.example.Service * '#cost > 100' # 跟踪耗时超过100ms的方法 ``` 2. **AsyncProfiler**： - 生成火焰图，直观展示CPU占用分布： ```bash ./profiler.sh -d 30 -f flamegraph.html <java_pid> ``` 3. **VisualVM**： - 监控线程状态、内存和GC活动。 --- ### **5. 示例场景** **问题**：某电商系统促销期间CPU飙升至200%，接口响应变慢。 **分析**： 1. `top`发现两个线程CPU占用90%以上。 2. `jstack`显示线程处于`RUNNABLE`状态，堆栈指向`JSON.parseObject()`方法。 3. 代码中存在循环解析大JSON文件且未启用流式解析。 **解决**： - 改用`JsonReader`流式解析。 - 增加JVM堆大小：`-Xmx8g -Xms8g`。 - 优化JSON数据结构，减少嵌套层级。 --- ### **6. 预防措施** 1. **代码审查**：避免死循环、未优化的算法和粗粒度锁。 2. **性能测试**：压测阶段使用JMeter模拟高并发，观察CPU和GC。 3. **监控告警**：集成Prometheus + Grafana监控JVM指标。 4. **合理配置**：根据负载调整线程池大小和JVM参数。 --- ### **总结** Java进程CPU占用200%的核心原因是 **线程长期占用CPU资源未释放**，可能由代码逻辑缺陷、锁竞争或GC频繁引发。通过`jstack`定位高CPU线程、结合`jstat`和堆转储分析，可快速定位问题根源。优化代码逻辑、调整JVM参数和合理使用工具是解决问题的关键。