Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >民间大神魔改 4090 48G 秒杀 5090!老黄显卡炒作被打脸,“最失败 50 系显卡”也支棱起不来了?

民间大神魔改 4090 48G 秒杀 5090!老黄显卡炒作被打脸,“最失败 50 系显卡”也支棱起不来了?

作者头像
深度学习与Python
发布于 2025-03-10 02:57:20
发布于 2025-03-10 02:57:20
5110
举报
作者 | 褚杏娟

近期,淘宝和闲鱼上很多厂家在出售至少 2.2 万的 4090 48G 显卡,这是一款“全新”、非官方规格的显卡。淘宝厂家甚至给出了基础款和升级款两种选择,其中基础款用的是拆机进口颗粒(19000 频率)和非定制全新 PCB 板,耐久度略低,升级版则用的是全新进口颗粒(21000 频率)和全新定制 PCB 板,耐久度高。不过厂家保证这两款都在前期性能稳定,并质保三年。

B 站上也早就有 UP 主对魔改版 4090 48G 显卡进行了初步测评,称这款显卡重量较大,显卡满载功率可达 450 瓦,原本运行 20 多分钟的工作流在该款显卡上仅需一分半。“在赛博绘图视频制作领域堪称顶级选择。满血的顶级算力搭配专业卡级别的显存,是非常不错的组合。如果后续改装水冷,将更具优势。”根据其他网友使用,4090 48G 显卡还可以支持 FP8,在游戏方面则与常规卡没有差别。

这款显卡也已经出走海外。来自加拿大的小哥在平台上晒出了自己在 eBay 上买的 RTX 4090 48G,让网友给出测试建议。eBay 官网显示,4090 48G 的售价要 3 万人民币起步。

现在,市面上还传出了 4090 96GB 版本已经被搓出来的消息,有人贴出了闲鱼上的预购消息和配置图,据说价格在 3700 美元左右(2.6 万人民币)。

不过,Slamtec 创始人兼 CTO Tony Huang 对此在推特上表示,“这应该不可能,4090 的上限就是 384bit/16bit*16Gbit GDDR6 = 48G”。

如何做到的?

要得到 4090 48G 显卡需要几步?网传有三个步骤:一、找一块 3090 的板子,挖掉核心;二、找一块 4090 的板子,挖掉核心,然后把这个核心焊到 3090 的板子上;三、再焊接更多对应显存到板子上,实现 48G。

上面是很诙谐的说法,但在闲鱼上确实能找到很多 4090 无核心、无显存的显卡板,被戏称为“4090 显卡手办”,价格在 100 元上下不等。

实际上,4090 魔改 48G 过程中还有一个关键的步骤,即显卡 bios。bios 是存储在显卡 ROM 芯片中的固件程序,可以初始化显卡硬件参数,协调 GPU/ 显存 / 供电模块协同工作。

知乎答主“宅叔”表示,“其实就是传言流出来那版 vbios,没有那版 vbios,就没有后续的 48G。vbios 有数字签名会和芯片内的安全芯片作相互校验,因此绕不过去,而在 2023 年流出来了一个工具,可以把不同品牌的 vbios(有数字签名版) 互刷,所以拿到 48G 的 vbios 就等于有了 48G 的 4090,无非是如何搬板,甚至有能力可以重新设计一张 PCB 来扩张。换句话说,如果未来有更大显存容量的 bios 流出,原则上也可以做更大显存的卡。”

有网友分析,3090 芯片发售时,显存颗粒最大 1GB,24GB 显存需要 24 颗,PCB 板正反面都有。4090 芯片发售时,显存颗粒达到 2GB,24GB 显存只需要 12 颗,PCB 板只有一面有焊盘。突然某一天,从英伟达总部流出 4090 48GB 改版显卡 bios,正好发现 4090 针脚定义和 3090 一样,可以焊在 3090 PCB 上。这样,4090 芯片 +3090 PCB+24 颗 2GB 显存 + 流出魔改显卡 bios=4090 48GB 显卡。据悉,大概一张卡的工本费要 5500 元左右。

有网友对比 A100 80G 的生成速度实际就比 4090 48G 快 20%,但是价格却贵了 6 倍多。目前已经有公司推出主打性价比的 4090 48G 推理 GPU 方案,帮助进行 DeepSeek 部署。另一方面,这也推动了 4090 显卡价格居高不下。

个人用户使用 4090 48G 跑 DeepSeek 的配置截图

4090 48G 不是最近才出现的,目前还没有用户曝出大问题。不过对于魔改卡,部分人还是比较谨慎,“魔改卡的工艺还是赶不上原厂卡。一般焊锡不是无铅高温的,常出现脱焊、爆锡等问题。第二,保修也是个问题,后期还管不管保修都不知道。个人玩家还是算了。”

模型苦“显存”久矣

看起来只是单纯扩大了显卡显存,但对于实际应用来说可能意义很大。

根据 AI 开发人员 Piyush Kashya 的计算,FP16 精度的 7B 参数模型至少需要 16.8GB 的 GPU 内存。类似地,haotian-liu 在 GitHub 上回答开发者提问时表示,通常 7B 参数的模型可以使用内存小于 24GB 的 GPU 运行,而 13B 参数模型大约需要 32 GB 内存。

显存大小限制了人们使用更大参数的模型,因此很多人用小模型或量化版本。但对于多模态模型,如 Flux 等的运行上,显存制约让很多人感到使用不便。

深度学习的训练过程中,GPU 显存溢出也是经常出现的问题。为此,人们通常使用减少训练批次大小、数据并行等方式来减少 GPU 内存的使用。GPU 内存优化也一直是厂商在做的事情。

另一方面,英伟达当前在企业级卡和消费级卡之间设置了明显的技术鸿沟。

比如,在计算能力方面,RTX 4090 属于 Ada Lovelace 架构,16384 个 CUDA 核心,由 128 个 SM 组成。H100 则为 Hopper 架构,16896 个 CUDA 核心和 528 个 4.0Tensor 核心,阉割了对图像渲染至关重要的光追核心(RT Core),多了 FP64 的处理单元。

而在多卡互联方面,4090 不支持 GPU 间直接通信,必须通过 CPU 中转,而 H100 可以借助 Nvlink 等进行卡间高速通信,支持 RDMA、GDS(GPU 存储直接访问)。值得注意是的,RTX 30 系列中只有 RTX 3090 支持 NVLink。

鉴于 DeepSeek 的热度,NVIDIA 发布了 DeepSeek R1 的量化版本 DeepSeek R1 FP4。借助对 Blackwell 架构的 TensorRT DeepSeek 优化(包括具备最先进生产精度的 FP4 性能),该模型实现了推理速度提升 25 倍、每 token 成本降低 20 倍的效果。

详情可查看:https://huggingface.co/nvidia/DeepSeek-R1-FP4

50 系显卡翻车?

大家对 4090 48G 的热情,也源于对英伟达“挤牙膏”发布的 50 系显卡的失望情绪。有 UP 主测评对比后表示,“4090 48G 秒杀 5090”。

“50 系是十年来最失败的一代显卡,这点是板上钉钉的,因为其存在重大缺陷,并且是前代已有的缺陷,并没有修复;而由于暴力拉规模导致故障风险扩大,大部分 5090 将在三年左右坏掉,故障为烧供电击穿核心。”有网友评价称。

与前代 4090 相比,5090 定价几乎翻了一番,而整个 RTX 50 系列产品的价格也都居高不下,此后还被炒出天价。消费者普遍认为这样的价格难以接受,尤其是考虑到性能的提升并不足以支撑售价翻倍。在质疑声中,黄仁勋直言不讳地表示,RTX 5090 的目标用户群体是那些追求顶级性能体验的发烧友,对他们而言,价格并不是首要考虑的因素。这一发言也引起了更大的不满。

而自发货以来,50 系被曝出的问题可太多了。截至目前,RTX 5090 已知问题包括:12 针电源接口熔化、黑屏、丢失 ROP(光栅单元)、电容烧毁、可靠性差等,还有用户遇到了错版问题。

其中,比较严重的就是 ROP 丢失问题。外媒 TechpowerUP 报道称,他们在 RTX 5090 评测样品上发现了 ROP 缺失问题,这源于 ZOTAC RTX 5090 样品测试中的运行速度要比其他样品慢。事实证明,该卡的 ROPS 仅为 168,而 ROPS 的官方规格数量为 176,后来发现几乎所有 AIB 都有这个问题。

5090 上缺少 ROP 单元导致游戏性能损失 4-5%。根据目前尚无法完全确认该问题是制造缺陷还是 bios 问题,但前者似乎更有可能,还有人猜测是老黄的管理出现了问题。而根据网友“MEGAsizeGPU”的说法,问题不在 bios 上,而在核心的 GB202 芯片上。

后来,英伟达公关总监 Ben Berraondo 紧急发声:这属于极个别芯片体质问题,对 AI 运算毫无影响,游戏性能平均损失仅 4%。但外媒表示,所谓缺少 1 个 ROP 为文字游戏,实际缺失量高达 8 个,英伟达将每个 ROP 单元的像素处理能力换算成虚拟单位,营造参数虚高的假象。

英伟达的 RTX 50 系列显卡是该公司最棘手的发布之一,这个论断并不过分。此次发布在多个环节出现重大失误:初期上市阶段,GeForce RTX 5090 在多家零售商的库存量持续是个位数,这种刻意控量供应策略导致实际供给不足,而需求激增主要源于黄牛抢购和高端硬件发烧友的追捧。值得注意的是,库存短缺也并非是英伟达 GPU 芯片产能不足导致的,推测问题可能出在封装测试环节、物流调度系统或渠道分配策略等深层供应链环节上。

外媒表示,50 系列显卡在市场上缺货的原因是英伟达正在进行“饥饿营销”。GPU 库存完全充足,但英伟达控制供应不释放库存,从而制造出短缺的假象。实际上,到四月或五月,GPU 将会大量释放。

参考链接:

https://www.zhihu.com/question/11803840385

https://www.bilibili.com/video/BV1RQfpYkEcg/?spm_id_from=333.337.search-card.all.click&vd_source=c7202342f6677650b47938178c8bfb3a

https://www.reddit.com/r/LocalLLaMA/comments/1iwhfl5/comment/medyq2f/

https://github.com/haotian-liu/LLaVA/issues/191

https://wccftech.com/nvidia-is-suppressing-inventory-levels-for-high-end-rtx-50-series-gpus/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
测完RTX 4090,结论居然是「性价比高」:开得起4K 144Hz高特效,功耗温度还降低了
9 月 21 日,英伟达在 GTC 大会上发布了全新架构的 GeForce RTX40 系列,新显卡因为台积电的 5nm 制程,全新光追处理器和 DLSS 3 实现了性能的大幅提升。
机器之心
2022/12/15
2K0
测完RTX 4090,结论居然是「性价比高」:开得起4K 144Hz高特效,功耗温度还降低了
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
在图形处理器(GPU)领域,英伟达、AMD 和英特尔占据主导地位已有一段时间了。虽然中国还有其他相关企业,但他们要打入美国市场一直以来都困难重重。
深度学习与Python
2025/03/24
990
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
A卡跑大模型,性能达到4090的80%,价格只有一半:陈天奇TVM团队出品
自预训练大模型兴起以来,人们面临的算力挑战就变得越来越大。为此,人们为大语言模型(LLM)提出了许多训练和推理的解决方案。显然,大多数高性能推理解决方案都基于 CUDA 并针对英伟达 GPU 进行了优化。
机器之心
2023/09/08
1.4K0
A卡跑大模型,性能达到4090的80%,价格只有一半:陈天奇TVM团队出品
黄牛落泪!全球显卡价格纷纷跳水,高价囤货滞销
---- 新智元报道   编辑:袁榭 好困 【新智元导读】你不买,我不买,显卡「等等党」终将胜利!不过别等太狠,过个十年八年,产品线会停掉的。 试看今日之寰球,何处显卡不跌价? 黄牛囤货砸手里,卖出一张赔一张! 3年了!你知道这3年是怎么过的吗?! 这三年,想要不花大价钱就能买到显卡,要么是运气亨通,要么就是技巧过人。 而那些想装机的普通玩家,不管想还是不想,都只能被迫加入「等等党」。 甚至在最热的时期,黄牛成功地为当代显卡开出了2倍甚至3倍于厂家建议零售价的市价。 (很应景,但确实还没到5年
新智元
2022/04/22
7770
黄牛落泪!全球显卡价格纷纷跳水,高价囤货滞销
人工智能研究者应该选择哪款显卡?
我在自己的网站中专门介绍过GPU的一些硬件基础知识:https://lulaoshi.info/gpu/gpu-basic/gpu.html。英伟达为优化深度学习的矩阵运算,在较新的微架构中,专门设计了Tensor Core这样的混合精度核心,因此,人工智能训练最好选择带有Tensor Core的GPU。
PP鲁
2020/06/29
3.2K0
英伟达显卡下架后换皮官宣!老黄:4080 12G拉胯,关我4070Ti什么事?
2023年,骗子的手段也在快速迭代!杀猪盘、网络兼职、疫情诈骗、虚拟投资诈骗……各种套路层出不穷。诈骗分子玩的是哪些新套路?我们又该怎么利用AI技术护身防骗?本周五上午10:00,新智元CEO杨静女士联合浪潮信息算法研究员张辉博士,以及B站顶流up主「图灵的猫」,为您带来一场精彩的AI反诈论坛。届时,新智元视频号将独家放送直播,敬请期待!
新智元
2023/01/09
9340
英伟达显卡下架后换皮官宣!老黄:4080 12G拉胯,关我4070Ti什么事?
被老黄撤回的RTX4080 12G要改名4070TI,网友:少扯虚的,不降价谁买?
还记得英伟达仅发布不到一个月,就被网友活活「骂到取消」的RTX4080 12G版吗?
新智元
2023/01/07
4050
被老黄撤回的RTX4080 12G要改名4070TI,网友:少扯虚的,不降价谁买?
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。
机器之心
2025/03/06
1570
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
NVIDIA消费级显卡4060/4090 AI训练能效比较
NVIDIA GeForce RTX 4060 是基于Ada Lovelace架构的一款显卡,它被设计为中端市场的产品,旨在提供高性能的同时保持相对较低的功耗和价格点。
用户7353950
2024/07/05
3.5K0
NVIDIA消费级显卡4060/4090 AI训练能效比较
7199元起,英伟达RTX 40系显卡终于来了:基础性能翻倍,光追翻4倍
机器之心报道 编辑:泽南、杜伟 最高端的 RTX4090 性价比最高,你没想到吧? 虽然因为产品太贵而被吐槽,但提起最强 AI 芯片、高端游戏 GPU,人们还是首先要看英伟达。9 月 20 日晚,GTC 大会在线上召开,万众期待的 RTX 40 系列显卡终于正式发布了。 与以往稍有不同,这场重要的 Keynote 显得朴实无华而且「简短」,黄仁勋直接站在空旷的元宇宙里开讲: ‍ 一个半小时收工。 在这场活动中,英伟达展示了 RTX、AI 芯片和元宇宙产品线 Omniverse 的最新进展,还包括它们对人
机器之心
2022/09/22
1.1K0
7199元起,英伟达RTX 40系显卡终于来了:基础性能翻倍,光追翻4倍
RTX 4090将机器学习速度提高3倍?黄仁勋:摩尔定律已死!
---- 新智元报道   编辑:武穆 【新智元导读】英伟达正式发布RTX40系列显卡后,知乎上,「如何评价RTX40系列显卡」成为热议话题。从讨论内容看,网友对细节的讨论,还是很专业的。 老黄终于在今年的GTC(GPU技术大会)2022上,公布了RTX 40系列GPU的配置。 很快,在知乎上,RTX40系显卡就成了热议话题。 性能高了,功耗也大了 从网友的讨论方向看,对于RTX40系显卡,大家关心的主要就两点:性能和价格。 对于RTX40系显卡的性能,大家基本买账。 下面这张RTX40 系显
新智元
2022/09/27
2.2K0
RTX 4090将机器学习速度提高3倍?黄仁勋:摩尔定律已死!
40系显卡首批7199元起!赛博朋克2077帧数x4,老黄:大部分像素都是AI预测而非计算
梦晨 Pine 发自 凹非寺 量子位 | 公众号 QbitAI 矿难来袭、玩家盘算何时下山之际,老黄带着他的40系显卡来了! 首发三款高端型号,RTX4090 24GB、RTX4080 16GB和12GB显存两版。 话不多说,直接上规格: 三款游戏帧数测试,在4K分辨率、全高设置、开启光追与DLSS情况下,4090提高到上代旗舰3090Ti的2-4倍,4080与3080Ti对比也提高到原来的2-3倍。 来看一组实机画面对比,来自《微软模拟飞行》。 另外英伟达还与波兰蠢驴合作,给《赛博朋克2077》
量子位
2022/09/22
4830
40系显卡首批7199元起!赛博朋克2077帧数x4,老黄:大部分像素都是AI预测而非计算
英伟达RTX 4090D正式发布:核心数减少11%,整体性能或降低10%!
12月29日消息,为了应对美国政府对高性能人工智能(AI)芯片新的出口管制政策,AI芯片大厂英伟达(NVIDIA)于28日晚间推出针对中国市场定制的降规版GeForce RTX 4090 D,以取代被限制的GeForce RTX 4090系列。据悉,字母“D”意为Dragon,代表2024年农历龙年。该显卡将于明年1月正式上市。
芯智讯
2023/12/29
4960
英伟达RTX 4090D正式发布:核心数减少11%,整体性能或降低10%!
显卡能烧水!玩家在RTX 3090公版显卡中竟发现了一个指套
近日,国外一位名叫Antony ter Hors的玩家花了1500美元,买回来了一块英伟达RTX 3090 Founders Edition。
新智元
2021/08/25
9060
RTX5090震撼发布,一文带你看懂英伟达CES2025发布会。
老黄身穿他一身bulingbuling的鳄鱼皮夹克,正式发布了英伟达的一系列新品。他上来第一句是:
数字生命卡兹克
2025/04/14
780
RTX5090震撼发布,一文带你看懂英伟达CES2025发布会。
硬刚4090,售价腰斩老黄!苏妈发布5nm新旗舰7900XTX,光追提升50%
由于老黄40系显卡耍猴般的命名和定价策略(4090除外),不少之前热切期待的发烧友纷纷表示失望,甚至连英伟达自己都不好意思了,破天荒地取消了12G版的4080,估计是拿回去重新起名了。
新智元
2023/01/07
9200
硬刚4090,售价腰斩老黄!苏妈发布5nm新旗舰7900XTX,光追提升50%
老黄“自废武功”:3060挖矿效率砍一半,同时推出专业矿卡,只为让你买上30系显卡
而本月25号,国行定价2499元的甜品级显卡3060即将发售,在喊真香之前,玩家们也不禁担心:这波真的能抢到?
量子位
2021/02/26
6350
老黄“自废武功”:3060挖矿效率砍一半,同时推出专业矿卡,只为让你买上30系显卡
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
在2025年的CES大会上,英伟达CEO黄仁勋在拉斯维加斯 CES 2025 展会上发表了主题演讲(keynote),涉及到的话题包括 GPU、AI、游戏、机器人等等。
通信行业搬砖工
2025/01/09
7480
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
CUDA核心数直接腰斩,老黄40系「花式命名」被骂上知乎热搜!
---- 新智元报道   编辑:好困 David Aeneas 【新智元导读】天价40系显卡发布后,英伟达股票喜迎一波大跌。网友:命名玩花活,4090竟是「性价比之王」,能不跌吗? 为啥玩家盼了这么久之后,对这次发布的40系显卡多半不买账呢? 30系矿难了,「你我200飞」也实现了,40系来了,也没矿老板和玩家们抢钱了,这怎么还骂起来了呢? 老黄告诉你:矿老板不抢的钱,我可以替他们抢。 如果说之前的「黄氏刀法」用的是手术刀,这次发布的三款卡,用的怕是青龙偃月刀。 来源:地狱男爵 你可以贵,但我
新智元
2022/09/27
8360
CUDA核心数直接腰斩,老黄40系「花式命名」被骂上知乎热搜!
【深度学习】4090测评首发!性能炸裂,一款真正的8K游戏显卡
与此同时,外媒纷纷做了英伟达最新旗舰机显卡的评测,让我们看看RTX 4090究竟怎么样?
黄博的机器学习圈子
2022/11/07
1.5K0
【深度学习】4090测评首发!性能炸裂,一款真正的8K游戏显卡
推荐阅读
测完RTX 4090,结论居然是「性价比高」:开得起4K 144Hz高特效,功耗温度还降低了
2K0
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
990
A卡跑大模型,性能达到4090的80%,价格只有一半:陈天奇TVM团队出品
1.4K0
黄牛落泪!全球显卡价格纷纷跳水,高价囤货滞销
7770
人工智能研究者应该选择哪款显卡?
3.2K0
英伟达显卡下架后换皮官宣!老黄:4080 12G拉胯,关我4070Ti什么事?
9340
被老黄撤回的RTX4080 12G要改名4070TI,网友:少扯虚的,不降价谁买?
4050
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
1570
NVIDIA消费级显卡4060/4090 AI训练能效比较
3.5K0
7199元起,英伟达RTX 40系显卡终于来了:基础性能翻倍,光追翻4倍
1.1K0
RTX 4090将机器学习速度提高3倍?黄仁勋:摩尔定律已死!
2.2K0
40系显卡首批7199元起!赛博朋克2077帧数x4,老黄:大部分像素都是AI预测而非计算
4830
英伟达RTX 4090D正式发布:核心数减少11%,整体性能或降低10%!
4960
显卡能烧水!玩家在RTX 3090公版显卡中竟发现了一个指套
9060
RTX5090震撼发布,一文带你看懂英伟达CES2025发布会。
780
硬刚4090,售价腰斩老黄!苏妈发布5nm新旗舰7900XTX,光追提升50%
9200
老黄“自废武功”:3060挖矿效率砍一半,同时推出专业矿卡,只为让你买上30系显卡
6350
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
7480
CUDA核心数直接腰斩,老黄40系「花式命名」被骂上知乎热搜!
8360
【深度学习】4090测评首发!性能炸裂,一款真正的8K游戏显卡
1.5K0
相关推荐
测完RTX 4090,结论居然是「性价比高」:开得起4K 144Hz高特效,功耗温度还降低了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档