zero - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签zero

#zero

AI论文陪读·ZeRO：分布式训练的第一篇论文（中英双语）

heidsoft 21天前2026-07-02 12:21:33

中文：训练时，每份参数在显存里实际要存多份东西。论文 Section 3.1 给出了具体公式：fp16 参数 + fp16 梯度 + Adam 优化器状态（fp...

17310

AI陪读ZeRO：万卡训练的第一块基石

heidsoft 21天前2026-07-02 12:20:44

训练大模型，显存是第一个拦路虎。一个 1000 亿参数（100B）的模型，单是模型参数就要 400GB（每个参数 4 字节），还没算梯度、优化器状态、中间激活值...

13810

DeepSpeed v0.19.2更新全解：ZeRO多反向传播增强、DeepCompile连续修复、AutoEP正式加入

福大大架构师每日一题 24天前2026-06-29 14:16:48

DeepSpeed 发布了 v0.19.2 补丁版本。从此次更新内容来看，这并不是一次简单的小修小补，而是一次围绕训练稳定性、ZeRO能力增强、DeepCom...

14700

MYSQL分组时条件都必须在查询中的设置

用户11690639 2026-06-182026-06-18 08:06:44

mysql> SELECT @@sql_mode; ±----------------------------------------------------...

8910

DeepSpeed v0.19.0 重大更新：训练稳定性、ZeRO、FPQuantizer、DeepCompile、Sequence Parallelism 全面增强，20 位贡献者带来 28 次提交

福大大架构师每日一题 2026-05-212026-05-21 20:21:28

如果你正在关注 DeepSpeed 的最新版本，那么 v0.19.0 绝对值得重点解读。这次更新覆盖范围非常广，从版本号更新、Transpose 重构、进程...

35010

Agent Zero：你的AI“数字分身”，一个会自我进化的个人智能体框架

沈宥 2026-05-092026-05-09 13:46:21

在AI领域，我们已经习惯了向模型提问并获得答案。但如果我们能拥有一个真正理解我们、能代表我们行动、并在过程中不断学习成长的“数字分身”呢？

52310

unity给物体添加可以包裹所有子物体的BoxCollider

用户12298955 2026-05-062026-05-06 16:09:22

14110

25：Few-Shot到Zero-Shot的自动化转换技巧

安全风信子 2026-04-052026-04-05 08:03:35

作者： HOS(安全风信子) 日期： 2026-04-02 主要来源平台： GitHub 摘要：本文深入探讨Few-Shot到Zero-Shot的自动化...

18010

三星Zero-ETL：计算下沉存储，告别数据搬家

数据存储前沿技术 2026-04-022026-04-02 10:44:19

在大数据和AI时代，海量数据如洪水般涌来，你是否还在为传统ETL流程中数据反复跨网络传输的I/O瓶颈和天价TCO买单？三星Zero-ETL架构横空出世，以“近数...

23410

DeepSpeed v0.18.8 发布：稳定性、Evoformer、多架构构建与ZeRO优化全面升级详解

福大大架构师每日一题 2026-03-312026-03-31 21:09:30

DeepSpeed v0.18.8 于 2026 年 3 月 13 日正式发布，这是一次以“修复问题 + 提升稳定性 + 改善开发与构建体验”为核心目标的补丁...

41310

神器分支OpenClaw-Zero-Token，告别 Token 账单

灬沙师弟 2026-03-302026-03-30 15:01:07

在 AI 开发领域，API Token 费用始终是绕不开的成本痛点——学生党尝鲜怕超支、中小企业高频调用成本高、个人开发者长期投入压力大。

3.2K22

优化DeepSpeed ZeRO，让大模型训练更经济

用户11764306 2026-03-182026-03-18 06:21:27

现代自然语言处理应用大多建立在预训练语言模型之上，这些模型编码了整门语言的词序列概率。随着时间的推移，这些模型变得越来越大，达到数十亿甚至数万亿参数的规模。在合...

33310

DeepSpeed v0.18.5 发布：PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级！

福大大架构师每日一题 2026-02-092026-02-09 14:47:02

2026 年 2 月 1 日，DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强，进一步完善了在多设备（尤其是 ...

93710

ZeRO-offload内存卸载｜CPU内存不该"躺平"

AI老马 2026-01-132026-01-13 20:34:49

zero-offload 主要结合了zero-2的训练策略，每个GPU上保留一份参数副本，将梯度和优化器分片后，由不同的GPU进行通信和更新。

59710

大模型训练｜ZeRO三阶段显存"压榨"指南

AI老马 2026-01-132026-01-13 20:34:10

混合精度训练过程中显存占用主要来自参数、梯度、优化器和中间激活值。仅参数、梯度和优化器占用内存为参数量的16倍，假如全参训练一个7.5B的模型，至少要120G的...

66310

大模型-零冗余优化器zero

AI老马 2026-01-132026-01-13 14:51:46

在训练过程中显存的用一般是四部分组成参数，梯度，优化器和中间激活值，前三项和参数量的的关系约为16倍。假如一个3B的模型，至少要48G的显存，加上中间激活着占用...

31110

ZeRo零冗余优化器参数更新过程和通信量计算

AI老马 2026-01-132026-01-13 14:50:03

策略：将模型的梯度和优化器状态进行分片。每个GPU上，保存一份完整的参数副本，以及分片后的梯度和优化器状态。

39810

Zero-Drift Op 在精密小电流中采集的优势

云深无际 2026-01-072026-01-07 14:44:37

下面那个 RSENSE = 1kΩ 串在负载回路的地线上，是一个低端电流采样电阻。（这个低端的意思是一段接在地）

35210

解决MySQL-sql_mode=only_full_group_by报错

用户4128047 2025-12-232025-12-23 15:28:53

具体报错：[Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clause and...

81710

go-zero v1.9.3 版本更新：一致性哈希负载均衡、gRPC优化、链路追踪修复、ORM完善等重要提升

福大大架构师每日一题 2025-12-192025-12-19 09:10:29

go-zero 发布了 v1.9.3 版本，本次更新在可靠性、性能以及与行业最佳实践的对齐方面做出了多项重要增强。包括一致性哈希负载均衡器、gRPC 连接默认行...

37710