首页
学习
活动
专区
圈层
工具
发布

#cpu

39. CPU/GPU 协同:vLLM的异构计算架构深度解析

安全风信子

作者:HOS(安全风信子) 日期:2026-01-19 来源平台:GitHub 摘要: 本文深入剖析vLLM框架中CPU/GPU协同计算的核心机制,重点探...

11110

【软考 CPU主频】外频、倍频

flos chen

理解 主频 = 外频 × 倍频 这个核心公式是解决此类问题的关键。在计算时,务必注意单位的统一(GHz和MHz的转换)。这类题目不仅考察基础计算,还可能延伸到对...

9710

《计算机组成原理》第 8 章 - CPU 的结构和功能

啊阿狸不会拉杆

定义:执行一条指令所需要的全部时间,由若干机器周期(CPU 周期)组成 阶段划分:

11210

【真实案例解密】8核CPU的数据库监控服务器负载飙到200+,系统却不卡?揭秘一个“假高负载”的线上奇案

俊才

在日常运维中,我们常常会依赖一些经典指标来判断服务器健康状况——比如 CPU 使用率、内存占用、磁盘 IO、网络流量,以及 CPU Load(负载)。但有时候,...

13010

LTX-2有意思了 Comfyui爆显存 这个整合包CPU跑只要5G显存

疯狂的KK

LTX2目前已经杀疯了,他能火,那就会推动其他的开源模型进行跟进更新,比如WAN2.X,比如前段时间发布的秒级出视频震惊!单张RTX 5090秒出高清视频,清华...

1.1K20

ZeRO-offload内存卸载|CPU内存不该"躺平"

AI老马

当输入的序列长度较短时,cpu上的参数更新相对较慢,影响整个训练的效率,为此zero-offload 提出了针对cpu参数更新的两大优化方案。

11510

CPU架构的演进:从冯·诺依曼到未来计算

christine-rr

在数字时代的浪潮中,中央处理器(CPU)作为计算机的“大脑”🧠,其架构的演进深刻地影响着我们使用技术的方式。从早期的简单指令执行到如今的多核并行处理,CPU架构...

20410

LPDDR5X:高能效CPU片上集成DDR

数据存储前沿技术

当前,AI和HPC应用正面临着内存带宽和系统功耗两大核心瓶颈。随着模型规模的爆炸式增长,数据中心在追求极致算力的同时,对总体拥有成本(TCO)和能效指标的控制压...

26910

函数调用时,CPU在背后偷偷干了什么?看完这篇我悟了!

码途随笔

正在调用那个函数,ebp和esp就调用哪个函数,ebp和esp之间的空间一直在变

6610

Linux操作系统-内核中的“权力游戏”:谁决定了哪个进程坐上CPU铁王座?

海棠蚀omo

说回正题,既然是分时操作系统,如果我们能随意更改一个进程的优先级,将其改的特别小,那么这个进程就会霸占cpu的资源。因为它优先级高啊,只要你不结束这个进程,那么...

9610

如何通过分析Linux服务器的内核日志解决高CPU利用率问题,特别是在多核系统中?

A5IDC服务器

在生产环境中,特别是多核Linux服务器上,系统偶尔会出现异常的高CPU利用率,这不仅影响业务性能,还可能导致服务不可用。我们今天以实战视角,带你深入理解如何借...

9010

从零开发分布式文件系统(5.3):IO操作为什么占用cpu

早起的鸟儿有虫吃

libaio / io_uring(中断):需要32个线程才能达到约1000万IOPS,且CPU已满载。大量时间花在内核和中断处理上。

12710

计算机基础入门(一):读懂核心部件CPU的“灵魂作用”

fashion

在数字化时代,计算机早已融入我们生活、学习和工作的方方面面。从日常使用的笔记本电脑、智能手机,到处理海量数据的服务器,这些设备之所以能高效运转,背后离不开一套精...

29810

当 GPU 成为主角:解锁 AI 集群中那 85% 的闲置 CPU 算力

深度学习与Python

近年来,全球 AI 算力规模按接近指数级的幅度增长,GPU 已然是整个数据中心的绝对主角,而 CPU 一般被认为只是承担数据预处理、任务调度和通信协同的次要部分...

20210

Linux服务器CPU和内存占用不高但负载高的问题排查指南

编程小白狼

在Linux服务器运维中,我们常常会遇到一个看似矛盾的现象:top命令显示CPU使用率并不高,内存也有充足余量,但uptime或top显示的负载平均值(load...

45410

ollama v0.12.9 发布:修复 CPU Only 系统性能回退并优化 GPU 与 ROCm 支持

福大大架构师每日一题

2025年11月2日,ollama 发布了 v0.12.9 最新版本,本次更新主要针对 CPU-only 系统的性能回退问题进行了修复,同时在 GPU 设备检测...

22210

AI处理器全景指南:从CPU到RPU,一文读懂算力核心

LiuDag

当你用手机刷脸解锁时,当ChatGPT秒回复杂问题时,当自动驾驶汽车识别路况时,背后都有一群“算力工人”在默默发力——它们就是AI处理器。从我们熟悉的C...

82210

架构师面试必备:Java性能调优实战指南——从OOM到CPU飙升的完整排查思路

用户6320865

在2025年的企业级应用开发领域,Java性能调优能力已成为架构师技术评估的核心指标。根据Gartner最新发布的《2025年企业软件质量报告》显示,在参与调研...

29910

360环视实时性评估:GPU加速性能与AI拓展潜力-基于米尔RK3576

用户10591265

本次360环视系统原型基于米尔电子MYD-LR3576开发板进行构建与评估。该开发板所搭载的瑞芯微RK3576芯片,集成了4核Cortex-A72、4核Cort...

17610

除了CPU和I/O,这些SQL都在忙什么?

姚远OracleACE

下面是Oracle AWR report中的"SQL Statistics"部分的“SQL ordered by Elapsed Time” 列表:

13510
领券