前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面试官必问:CPU 100%该如何处理?

面试官必问:CPU 100%该如何处理?

原创
作者头像
程序员江小北
发布2024-06-29 18:09:39
1560
发布2024-06-29 18:09:39
举报
文章被收录于专栏:面渣逆袭

小北说在前面

CPU占用率突然飙升是技术人员常遇到的一个棘手问题,它是一个与具体技术无关的普遍挑战。

这个问题可以很简单,也可以相当复杂。

有时候,只是一个死循环在作祟。

有时候,是死锁导致的。

有时候,代码中有不必要的同步块。

有时候,是大量计算密集型任务在运行。

有时候,是线程数过多引起的。

有时候,是频繁的上下文切换。

有时候,是内存不足的问题。

有时候,是频繁的垃圾回收。

有时候,是内存泄漏导致的。

等等。

导致CPU占用率飙升的问题多种多样,不同系统中的不同场景,其原因可能各不相同。

在这里,小北将对这些问题进行系统化、体系化的梳理,帮助大家在实际工作和面试过程中能够清晰、有条理地分析和解决CPU占用率过高的问题

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

一、cpu占用很高的3大类型,9大场景

1.1业务类问题

1.1.1 死循环

死循环是指程序在特定条件下进入了一个无限循环,无法跳出,导致CPU资源被完全占用。

例如:我们有一段代码用来检查文件的更新状态,但由于逻辑错误,条件永远无法满足,结果程序进入了死循环。

代码语言:java
复制
while (true) {
    if (file.isUpdated()) {
        break;
    }
}
1.1.2 死锁

死锁是指两个或多个线程互相等待对方释放资源,导致所有线程都无法继续执行,CPU资源被消耗殆尽。

发生死锁后,就会存在忙等待或自旋锁等编程问题,从而导致 繁忙等待问题,从而导致 CPU 100%

1.1.3 不必要的代码块

一些冗余、不必要的代码块在运行时占用了大量的CPU资源。

例如,不需要的地方使用synchronized块。public synchronized void unnecessarySync() { // 执行一些不需要同步的操作 }在不需要的地方使用synchronized块,会导致线程竞争和上下文切换

1.2、并发类问题

1.2.1 大量计算密集型的任务

大量计算密集型任务在同一时间运行,会导致CPU资源被完全占用。

例如:在数据分析或科学计算中,多个计算密集型任务同时运行

1.2.2 大量并发线程

统中存在大量并发线程,线程切换频繁,导致CPU资源被大量消耗在上下文切换上

例如:Web服务器同时处理大量请求,每个请求都创建一个新线程

解决方案:使用线程池来限制并发线程数量

1.2.3 大量的上下文切换

当系统中存在大量线程时,CPU在不同线程间频繁切换,导致性能下降

例如:一个程序中开启了数百个线程,每个线程都在不断进行I/O操作for (int i = 0; i < 1000; i++) { new Thread(new IOHandler()).start(); }线程是很宝贵的资源,开启线程一定要合理的控制线程数量

3、内存类问题

1.3.1 内存不足

当系统内存不足时,就会将磁盘存储作为虚拟内存使用,而虚拟内存的运行速度要慢得多。

例如:直接一次性加载一个非常大的文件到内存中,导致内存不足byte[] largeData = Files.readAllBytes(Paths.get("largeFile.txt"));这种过度的分页和交换会导致 CPU 占用率居高不下,因为处理器需要花费更多时间来管理内存访问,而不是高效地执行进程。

解决方案:优化内存使用,采用流式处理避免一次性加载大文件

代码语言:java
复制
try (BufferedReader reader = Files.newBufferedReader(Paths.get("largeFile.txt"))) {
    String line;
    while ((line = reader.readLine()) != null) {
        // 处理每一行数据
    }
}
1.3.2 频繁GC

频繁的垃圾回收(GC)操作会占用大量CPU资源,导致性能下降。

例如:程序中频繁创建和销毁对象,导致GC频繁触发for (int i = 0; i < 1000000; i++) { String temp = new String("temp" + i); }解决方案:优化对象创建和销毁,减少临时对象的生成。

1.3.4 内存泄漏

内存泄漏导致可用内存逐渐减少,最终触发频繁的GC操作,占用大量CPU资源

例如:某个数据结构中不断添加对象,却从未删除,导致内存泄漏List<Object> list = new ArrayList<>(); while (true) { list.add(new Object()); }解决方案:定期清理不再使用的对象,使用合适的数据结构

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

这么多会导致CPU飙升100%的原因,那么该如何解决呢?undefined有没有一个标准的套路,可以帮助我快速定位呢?

答案是;当然有

二、CPU 飙升100%的解决思路和方法论

2.1 使用jstack 解决CPU 100%问题

使用jstack 解决 CPU 100%问题,在方法论上要用到的两个核心命令

  • top 命令查看TOP N线程,
  • jstack命令查看堆栈信息
2.1.1 确定Java进程ID

首先,需要找到CPU占用高的Java进程的PID(进程ID)。可以使用 top 或 ps 命令来找到该进程。

代码语言:bash
复制
top -H -p <PID>
2.1.2 找到占用CPU高的线程ID

在 top 的输出中,按 P 键可以按CPU使用率排序,找到使用CPU最多的线程。

记下这些线程的ID(nid),这些ID是十进制的。

2.1.3 将线程ID转换为十六进制

jstack 输出的线程ID是十六进制的,因此需要将找到的高CPU使用率的线程ID转换为十六进制。可以使用 printf 命令:

代码语言:bash
复制
printf "%x\n" <thread_id>
2.1.3 使用 jstack 生成线程快照

使用 jstack 命令生成Java进程的线程快照:

代码语言:bash
复制
jstack -l <PID> > thread_dump.txt
2.1.4 分析线程快照

在生成的 thread_dump.txt 文件中,查找转换后的十六进制线程ID。可以使用 grep 命令:

代码语言:bash
复制
grep "0x<hex_thread_id>" thread_dump.txt -A 20

这将显示包含该线程ID的线程栈信息。分析这些线程栈,找到可能导致CPU高占用的代码

2.2 使用阿里开源Arthas性能监控工具

Arthas 是一款强大的 Java 诊断工具,能够帮助开发人员快速定位和解决 CPU 100% 的问题

使用arthas解决CPU 100%问题,在方法论上要用到两个核心命令:

  • dashboard 命令查看TOP N线程,
  • thread 命令查看堆栈信息
2.2.1. 安装和启动 Arthas

安装 Arthas

通过 curl 命令下载并安装 Arthas:

代码语言:bash
复制
curl -O https://arthas.aliyun.com/arthas-boot.jar

注意:在生产环境中,我们一般是选择其中一台机器开启Arthas监控,因为使用 Arthas 对系统性能会有一定影响

2.2.2 启动 Arthas

启动目标 Java 应用程序,然后在终端中运行:

代码语言:bash
复制
java -jar arthas-boot.jar

Arthas 会显示当前运行的 Java 进程列表,选择要诊断的 Java 进程:例如输入1显示如下

2.2.3 使用 dashboard 命令查看系统概况

连接到目标进程后,使用 dashboard 命令查看系统的整体性能概况,包括 CPU 使用情况

代码语言:bash
复制
dashboard
2.2.4 使用 thread 命令定位高 CPU 线程

查看线程列表

使用 thread 命令查看所有线程的信息,并找出 CPU 使用率高的线程

代码语言:bash
复制
thread -n 3

这个命令会显示 CPU 使用率最高的 3 个线程,输出中会包含每个线程的 ID 和名称

2.2.5 查看具体线程的堆栈信息

假设你发现线程 ID 为 8 的线程 CPU 使用率很高,可以进一步查看该线程的堆栈信息:

代码语言:bash
复制
thread 8

该命令会显示线程 8 的详细堆栈信息,帮助你定位到具体的代码位置

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

三、总结

工具的选择建议使用arthas,它还有很多的功能在实际中很有用

感兴趣的同学可以自行前往官网学习了解:https://arthas.aliyun.com/doc/

需要注意的是:大家在面试的时候如果遇到cpu被打满该如何排查这样的问题,千万不要上来就回答使用arthas来定位问题。

在生产环境中出现问题时,我们第一时间要做的是解决问题,所以回答要符合实际场景,不然面试官一听,就知道你是背的八股文。

那么该如何回答呢?

生产中如果出现 CPU 飙升100% 的情况

  1. 先确定前一天或者最近是否有新版本发布或者依赖域的服务有新版本发布,有的话第一时间回滚。
  2. 如果最近或很长一段时间都没有新版本发布,那就先申请紧急扩容,增加机器

最后才是通过文本的这一套套路排查具体的原因分析和解决方案

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 小北说在前面
  • 一、cpu占用很高的3大类型,9大场景
    • 1.1业务类问题
      • 1.1.1 死循环
      • 1.1.2 死锁
      • 1.1.3 不必要的代码块
    • 1.2、并发类问题
      • 1.2.1 大量计算密集型的任务
      • 1.2.2 大量并发线程
      • 1.2.3 大量的上下文切换
    • 3、内存类问题
      • 1.3.1 内存不足
      • 1.3.2 频繁GC
      • 1.3.4 内存泄漏
  • 二、CPU 飙升100%的解决思路和方法论
    • 2.1 使用jstack 解决CPU 100%问题
      • 2.1.1 确定Java进程ID
      • 2.1.2 找到占用CPU高的线程ID
      • 2.1.3 将线程ID转换为十六进制
      • 2.1.3 使用 jstack 生成线程快照
      • 2.1.4 分析线程快照
    • 2.2 使用阿里开源Arthas性能监控工具
      • 2.2.1. 安装和启动 Arthas
      • 2.2.2 启动 Arthas
      • 2.2.3 使用 dashboard 命令查看系统概况
      • 2.2.4 使用 thread 命令定位高 CPU 线程
      • 2.2.5 查看具体线程的堆栈信息
  • 三、总结
相关产品与服务
应用性能监控
应用性能监控(Application Performance Management,APM)是一款应用性能管理平台,基于实时多语言应用探针全量采集技术,为您提供分布式性能分析和故障自检能力。APM 协助您在复杂的业务系统里快速定位性能问题,降低 MTTR(平均故障恢复时间),实时了解并追踪应用性能,提升用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档