Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >面向大模型时代的云存储架构

面向大模型时代的云存储架构

作者头像
云存储
发布于 2025-04-30 02:28:47
发布于 2025-04-30 02:28:47
930
举报
文章被收录于专栏:腾讯云存储腾讯云存储

4 月 20 日,由和腾讯云架构师技术同盟和腾讯云 TVP 联合主办的「AI 时代,程序员只剩架构师——腾讯云架构师技术沙龙」在北京召开。本次沙龙汇聚行业顶尖架构师,多角度深入解析 AI 时代架构设计的技术发展、落地应用,共同探寻 AI 时代架构师的进阶路径。沙龙活动中腾讯云存储研发总监严俊明分享了《面向大模型时代的云存储架构》的主题演讲。

腾讯云存储研发总监 严俊明

过去,传统存储提供标准化的接口和存储类型来让业务适配,AI 多样化的场景对存储提出更为复杂的要求,未来存储架构将朝着“场景定义存储”的新范式演进。

据 OpenAI 研究显示,大模型的智能程度与算力、参数规模呈正相关。训练大模型所需的基础设施已达万卡级别,参数从亿级跃升至万亿级,大模型为存储带来巨大的机遇与挑战。在大模型采集、清洗、训练、推理、“智”理等环节,对存储基础设施提出规模、性能、稳定等多维度的要求。 其中,核心矛盾是大模型的海量数据需求和极致性能需求之间的矛盾。对此,严俊明表示,“大模型对存储的要求是既要、又要,既要海量低成本的存储引擎,同时又要很高的性能要求,然而企业实践的过程中,这两者往往很难兼顾。”

腾讯云尝试做了一些创新技术探索:构建统一的对象存储底座,加速数据流转,降低企业因为数据流转带来的边际成本;在对象存储 COS 上构建存储加速层,来提高原始数据清洗流程的效率,使数据处理更高效;在数据生产阶段,提供多元化数据处理能力,通过数据服务做到更智能的数据治理,实现更弹性、更高效、更智能的效果。

在数据采集阶段,腾讯云提供数据迁移平台进行稳定、高可靠的传输服务,在 26 个物理区部署存储服务,支持TB级别的公网技术带宽,通过 3200 个全球加速节点来满足企业在训练模型阶段所需要数据的采集性能效率。在存储阶段,基于自研对象存储 YottaStore,单集群为 100EB 级别,具备多 AZ 容灾能力,持久性达 12 个 9。在数据清洗阶段,自研 GooseFS 三级加速体系,提升数据使用效率。模型训练阶段,自研 GooseFS-X 高性能存储,提升大模型预训练效率;在分发阶段,通过 GooseFS AZ 加速器来提升大模型分发效率。

此外,腾讯云还提供一站式安全解决方案来保障数据内容安全。例如针对 AIGC 生成的内容,一站式审核是否符合安全合规标准。腾讯云采用自研的数据水印技术,对数据进行知识版权。腾讯云推出跨模态检索工具 MetaInsight,做到跨模态的数据检索,如以文搜图、以图搜图、文搜视频等。

严俊明表示,传统存储是提供一些接口和存储类型,让业务来适配存储接口。然而这样的存储方式无法满足 AI 时代各类场景需求,因此未来技术发展可能会朝着“场景定义存储”方向来演进。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云存储 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI 时代架构师的破局之道与进阶之路,腾讯云架构师技术沙龙圆满落幕
AI 技术发展日新月异,AI 在自动编程展现巨大的潜力,因此企业对开发者提出更高的要求,不仅会写代码,还需具备架构设计、产品思维等综合能力。在这样的背景下,AI 时代下架构师的价值定位是怎样?面对技术的更新迭代,架构师如何规划自身成长路径,更好地增强竞争力,以寻求破局之道?
TVP官方团队
2025/04/28
1460
AI 时代架构师的破局之道与进阶之路,腾讯云架构师技术沙龙圆满落幕
AIGC 场景下存储与数据管理的挑战与应对
10月28日,"寻宝 AI 时代——OSC 源创会苏州站暨 Techo TVP 技术沙龙"在苏州圆满落幕。腾讯云存储专家解决方案架构师屠伟新带来《AIGC 场景下存储与数据管理的挑战与应对》主题分享。下面我们一起来学习回顾一下AIGC场景下的存储解决方案。
云存储
2023/12/02
3240
AIGC 场景下存储与数据管理的挑战与应对
率先迈入“10微秒”时代,腾讯云存储跑出加速度
海量数据时代,大容量、低成本、易扩容的云存储无疑是大势所趋。 在全球市场,以AWS、Azure等为代表的云计算厂商,正在超越传统企业级存储厂商,成为全球企业存储市场数一数二的企业存储供应商。
科技云报道
2022/04/16
1.5K0
率先迈入“10微秒”时代,腾讯云存储跑出加速度
硬盘大涨价?CG动画渲染师:云存储更香了
杨净 边策 发自 凹非寺 量子位 报道 | 公众号 QbitAI 挖矿的现在连硬盘都不放过了。 一块大容量硬盘涨价超过了100%,做视频的朋友现在是叫苦不迭。 u1s1(有一说一),云存储现在好像有点性价比那意思了。 这时候一定又有人说,云存储的读写速度拿来剪视频,真的不是开玩笑吗? 以前不一定,现在没准还真的可以。 我发四,这是我一动画渲染师朋友告诉我的。 “云渲染”是一种什么体验? 所谓渲染,作为模型到动画的一个关键步骤,需要大量算力来计算。 有这样一组数据。 CG动画经典《阿丽塔:战斗天使》,就
量子位
2023/03/10
1.1K0
硬盘大涨价?CG动画渲染师:云存储更香了
腾讯云COS Data Lake在AIGC和自动驾驶技术领域的最新解决方案
在当今快速发展的人工智能领域,数据作为AI模型训练的基石,其处理和存储方式对模型的性能有着决定性影响。特别是在AIGC和自动驾驶技术的研发中,对数据处理的要求更是严苛。
云存储
2024/03/30
2310
腾讯云COS Data Lake在AIGC和自动驾驶技术领域的最新解决方案
直播报名中 | 湖存储第四期元数据加速能力篇
“ 雁栖学堂-湖存储专题直播是腾讯云主办的国内首个湖存储百科知识直播节目,是一个围绕湖存储技术领域,基于存储加速服务,覆盖了前沿趋势,时事热点,客户案例,大咖分享,开发者成长路径等内容的直播交流平台。 ” 雁栖学堂-湖存储专题直播第三期将邀请到腾讯云存储高级工程师“严俊明”,介绍GooseFS:元数据加速能力篇。 分享内容 本次分享会通过对传统大数据分析的优劣势进行深入分析,探讨云时代大数据分析发展阶段及趋势,以及云原生环境下腾讯云存储如果应对大数据分析所面临的元数据性能挑战。 分享大纲 元数
云存储
2021/10/13
3730
腾讯云原生数据湖存储服务能力再上新,三级加速体系助力企业用数赋智
2022 导语 随着数据价值被越来越多企业认可,数据湖存储已成为企业级存储的首选和新一代提升生产力的服务。12月1日,在2022腾讯数字生态大会存储专场,腾讯云升级了云原生数据湖产品能力,并详细阐释了其设计理念,对其在多个行业的应用进行了案例分享,为更多企业提供降低存储成本、提升存储性能的实践参考。 当下,数据的生产、存储和消费模式日新月异,随着数据的爆发式增长,在数据存储和处理方面的降本增效成为企业亟待解决的问题。 腾讯云存储高级产品经理林楠认为,“市场需要一个更大、更快、更全能、更低成本的存储服务。数据
云存储
2022/12/06
4850
腾讯云原生数据湖存储服务能力再上新,三级加速体系助力企业用数赋智
这届存储,为大模型而生!
据测算,数据存储约占大模型训练整体工程量的20-30%。随着更多AIGC的产生,这个比例还在继续提升。
小腾资讯君
2024/04/08
2870
这届存储,为大模型而生!
AI大模型疯长,存储扛住了吗?
过去一年半,AI大模型标志性的应用相继出现,从ChatGPT到Sora一次次刷新人们的认知。震撼的背后,是大模型参数指数级的增长。
科技云报道
2024/04/18
2270
AI大模型疯长,存储扛住了吗?
三级加速,打造高性能云原生数据湖
日前,腾讯云专家工程师严俊明老师,在云+社区技术沙龙「云原生」专场,分享了基于对象存储的云原生数据湖最新技术突破,包括云原生数据湖业务场景以及技术架构。
云存储
2021/03/18
1.2K0
三级加速,打造高性能云原生数据湖
存算分离架构下的数据湖架构
日前,腾讯云高级工程师程力老师在 ArchSummit 全球架构师峰会上分享了存算分离架构下的数据湖架构。
云存储
2021/05/28
3K0
存算分离架构下的数据湖架构
COS数据湖存储引领大数据存储和自动驾驶存储发展趋势
数据是企业的核心资产,随着数据规模的快速增长,企业对存储功能和性能的要求也在不断增加。对云厂商和企业用户来说,如何在提升业务性能的同时降低成本是一巨大挑战。11月26日在QCon大会上,腾讯云数据湖存储研发负责人严俊明和技术专家程力受邀分享了数据湖存储的关键技术,并分享了数据湖存储在大数据及自动驾驶场景下的落地实践,助力用户业务降本增效。 下面,让我们一起回顾下两位老师的精彩演讲内容👇 数据湖是一种可拓展的技术架构,将数据存储、计算、分析、AI等能力集成整合为一款多元化的解决方案,从数据中挖掘价值;支持
云存储
2022/12/15
1.3K0
COS数据湖存储引领大数据存储和自动驾驶存储发展趋势
AIGC数据处理与存储解决方案
2023年数智中国AIGC科技周· AI云智上海专场在普陀区召开。活动以“智能涌现”、“算力突围”、“超越现实”三大篇章开启,第一篇章以“智能涌现”开幕、重塑数实融合终极愿景;第二篇章“算力突围”,以AI为引擎,以计算为基石,构筑数字底座;第三篇章“超越现实”,引领“空间计算”新时代,进入“虚实相生”新阶段。
云存储
2023/08/28
1K0
AIGC数据处理与存储解决方案
喜报!腾讯云存储荣获2024年度分布式存储产品金奖
2024年11月8日,由 DOIT 传媒主办,中国计算机学会信息存储专委会、武汉光电国家研究中心和百易存储研究院支持的“2024中国数据与存储峰会”在北京召开。本次峰会以“智数据 · AI 未来”为主题,汇聚了全球领先的数据存储企业代表、专家学者及行业用户,共同探讨了数据存储领域的最新技术进展、市场趋势和应用案例。
云存储
2025/02/10
1040
喜报!腾讯云存储荣获2024年度分布式存储产品金奖
腾讯云存储专家将亮相DOIT闪存峰会分享AIGC多模态背后的存储之道
今年,腾讯云曾重磅发布全面升级的AIGC场景存储解决方案,以应对大模型对当前数据存储的巨大挑战。针对AI大模型的数据采集清洗、训练、推理、数据治理全流程输出了强大的云存储能力。
云存储
2024/08/29
1810
腾讯云存储专家将亮相DOIT闪存峰会分享AIGC多模态背后的存储之道
数据湖存储在大模型中的应用
9月5日,浪潮信息新产品“互联网+AIGC”行业巡展在深圳举行。本次巡展以“智算 开新局·创新机”为主题,腾讯云存储受邀分享数据湖存储在大模型中的应用,并在展区对腾讯云存储解决方案进行了全面的展示,引来众多参会者围观。
云存储
2023/11/01
8950
数据湖存储在大模型中的应用
腾讯云 Data Platform — AI 与机器人时代的数据存储与管理解决方案
腾讯云存储通过推出 Data Platform 框架性解决方案,结合对象存储 COS、智能检索 MetaInsight、数据万象 CI 和数据加速器 GooseFS 2.0 等关键组件,满足 AI 与机器人时代对存储的五大核心需求,引领云存储技术创新,助力企业高效利用数据。
云存储
2025/04/18
1180
腾讯云 Data Platform — AI 与机器人时代的数据存储与管理解决方案
腾讯云 AI 存储解决方案持续升级,为 AI 全业务场景提供全面支持
其中,GooseFS 2.0为 AI 场景深度优化,提供 GBps 单链接性能,数据访问性能逼近硬件资源极限;文件存储 CFS Turbo 打通多云数据形成端到端的解决方案,提升 AI 场景运转效率;数据万象、企业网盘、日志服务等存储产品与 DeepSeek 大模型深度集成,帮助企业应对 AI 时代数据井喷下的成本和性能压力。
云存储
2025/04/04
1340
腾讯云 AI 存储解决方案持续升级,为 AI 全业务场景提供全面支持
全球架构师峰会主题演讲:云原生数据湖存储的架构发展和数据治理
ArchSummit 全球架构师峰会是重点面向高端技术管理者、架构师的技术会议,聚焦业界强大的技术成果,秉承“实践第一、案例为主”的原则,展示先进技术在行业中的典型实践,以及技术在企业转型、发展中的推动作用。旨在帮助技术管理者、CTO、架构师做好技术选型、技术团队组建与管理,并确立技术对于产品和业务的关键作用。 腾讯云存储资深专家程力受邀参加数据存储的挑战与应对之策专题演讲,分享腾讯云原生数据湖存储的架构发展,和如何应对多种业务场景下的存储挑战。程力主要负责腾讯云数据湖存储 GooseFS 的设计和研发,同
云存储
2023/04/25
3660
全球架构师峰会主题演讲:云原生数据湖存储的架构发展和数据治理
腾讯云数据湖赋能AIGC多模态大模型
近日,腾讯云存储解决方案总监温涛受邀在2024数据基础设施技术峰会-“智算中心技术创新论坛”分享了腾讯云的数据智能生态创新之路,剖析腾讯云数据湖在赋能AIGC多模态大模型方面的应用实践。
云存储
2024/05/24
5310
腾讯云数据湖赋能AIGC多模态大模型
推荐阅读
相关推荐
AI 时代架构师的破局之道与进阶之路,腾讯云架构师技术沙龙圆满落幕
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档