Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

作者头像
深度学习与Python
发布于 2023-08-09 01:49:34
发布于 2023-08-09 01:49:34
5410
举报

作者 | 褚杏娟

6 月 28 日,火山引擎发布了大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即 Model-as-a-Service)。据悉,目前“火山方舟”集成了百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI(以拼音首字母排序)等多家 AI 科技公司及科研院所的大模型,并已启动邀测。

对于中国的大模型发展,火山引擎有下面几个关键判断:

第一,未来的大模型 市场将是一个百花齐放的多模型生态。由于安全信任、行业壁垒和成本等因素,这个生态将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型。同时,开放的市场竞争和模型多样性又会进一步促进整个技术发展。

第二,企业,尤其是行业头部企业,自身对于大模型的应用,将是“1 + N”的应用模式,即:企业通过自研或者与三方模型服务商的深度合作,形成企业自身的一个主力模型;在这个主力模型之外的不同场景中,企业还会同时应用 N 个外部模型。

基于以上判断,火山引擎定位于为模型生产端和模型应用端提供底层能力和产品方案,解决计算、安全、成本等通用问题。据悉,火山方舟由以下几个核心部分构成:

第一个是模型广场,许多模型提供商会提供不同版本 / 不同尺寸的模型。企业可以直接与这些模型交互。在火山引擎上可以直接调用推理 API,接入生产环境。适合进行快速分析和 AB 实验。

第二个是模型评估。企业要把大模型用好,首先得想好自己的业务需求,并为之设计一套可量化的评估指标,并在不断对比 / 评估 / 试验的过程中,积累评估数据、快速迭代。要给多样化的业务场景和业务入口,挑选不同的、最合适的模型。

第三个是模型精调。对于要求较高的垂直场景,用户可能需要利用自有数据和领域非公开数据,进行持续训练,并且建设和积累自己的精调数据集。对精调的良好运用也有益于对更小尺寸模型的利用, 在特定工作上达到逼近通用大模型的水平,由此降低推理成本。火山方舟可以对一个模型或多个基座模型同时发起训练任务,同时实时跟踪模型精调的效果指标和运行情况。

第四个是安全和信任机制。据悉,火山大模型服务平台提供了基于安全沙箱、硬件加密和联邦学习的多套大模型安全与信任解决方案。吴迪表示,“火山方舟”还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案。

随着平台不断迭代, 企业对大模型的资源供应将更为弹性 / 动态和廉价。火山引擎通过流量错峰、训推一体等手段,将进一步降低推理的单位成本。吴迪表示,这也是在大模型时代,上云所带来的重要优势。除此之外, 火山引擎将和大模型提供商联合进行深度的性能优化,包括火山引擎知名的 veLego 优化框架,还包括火山引擎将不断和大模型提供商分享 / 共创的诸多量化 /batching/ 调度等优化技术。

火山引擎总裁谭待 认为,除了算法、数据和算力外,企业做大模型还需要考虑以下问题:

  • 安全与信任。这里的安全和信任是一种双向信任。大模型服务商除了考虑模型方案和代码不被泄露,也需要考虑到各个应用企业的安全问题,保障企业在调用大模型时自己的 prompt 或精调数据不会被泄露。
  • 性价比。之前大家处于模型研发的早期,更多考虑的是模型预训练阶段的成本问题,但后期模型的推理计算才是成本更高的环节。只有推理成本做到足够低,才能让大模型真正被广泛使用。
  • 生态系统。生成式模型并不知道自己擅长什么、不擅长什么,需要我们告诉他们自己的优劣势,并且在他们不擅长的地方为其提供下游的模型、API 和插件,帮助他们更好地解决问题,帮助大模型“长出手和脚”。

火山引擎智能算法负责人吴迪表示,与其他很多云厂商单纯提供算力、基础底座不同,火山方舟平台一方面会在资源和优化方面跟模型提供商进行非常深度的合作,长期致力于降低推理成本,另一方面,火山算法团队会和客户做重点的应用共建和应用落地,催化整个大模型、大算力在千行百业的落地速度。

据悉,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索,利用大模型能力促进降本增效。这些内部实践也在快速打磨“火山方舟”,推动平台能力的进一步完善。“火山方舟”的首批邀测企业还包括金融、汽车、消费等众多行业的客户。

谭待坦言,“火山方舟”还在起步阶段,工具链和下游应用插件需要持续完善,平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
2023 上半年,海内外经历了一场「百模大战」。从科技巨头、科研机构、创业公司到各传统行业,纷纷掀起了炼大模型的热潮。
机器之心
2023/08/07
5320
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
火山引擎给大模型造大底座!MiniMax、智谱AI等已登陆
它将国内多个明星大模型放在平台上,如MiniMax、智谱AI、复旦MOSS、百川智能、IDEA、澜舟科技、出门问问等。
量子位
2023/08/05
3100
火山引擎给大模型造大底座!MiniMax、智谱AI等已登陆
大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘
5月15日,2024火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布,字节跳动内部自研的豆包大模型正式在火山引擎上对外开放服务。
机器之心
2024/05/22
3480
大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘
大模型时代需要什么样的安全水位?火山方舟首度公开「会话无痕」技术细节
信号指向很清晰:把基础设施成本打下来,就是为了应用的爆发,但「算力价格」这把尺子还不够用。
机器之心
2025/02/14
940
大模型时代需要什么样的安全水位?火山方舟首度公开「会话无痕」技术细节
抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%
大模型正以前所未有的速度重塑我们的工作和生活方式,人们期待大模型走向千行百业,为实际业务带来真正的价值提升。
新智元
2024/05/22
9320
抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%
没有大招的火山引擎,拿下70%大模型玩家
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 有没有在开发大模型?在学习。 什么时候发布大模型?没计划。 当被问起自研大模型,字节跳动副总裁杨震原口风甚严。但席卷全球的这场大模型竞逐战,没有人会主动放弃阵地。 最新线索,在上海露出端倪。 火山引擎对外的最新技术、产品发布动作中,我们发现:炼大模型的基础设施,不仅已经在字节内部运转,还到了能够对外输出“技术秘籍”的阶段。 直观的数字,更能说明情况: 抖音2022年最火特效「AI绘画」,就是在火山引擎机器学习平台上训练而成。在训练场景下,基于Stable
量子位
2023/05/06
3350
没有大招的火山引擎,拿下70%大模型玩家
腾讯云MaaS再升级:混元筑底、生态扩容,持续推进“效能革命”
9月7日,2023腾讯全球数字生态大会于深圳举办。会上,腾讯首次对外公布腾讯混元大模型进展,并宣布从技术底座、平台能力、智能应用三大维度升级MaaS能力。基于自研腾讯混元大模型,同时支持业内20余款主流开源模型,助力客户构建专属大模型及智能应用,加速模型产业落地,推进“效能革命”。
小腾资讯君
2023/09/08
5550
豆包模型能力大幅提升,中国版Vision Pro正式发布!今年大模型市场份额第一还会是百度吗?|AI日报
昆仑万维推出全球首款AI短剧平台SkyReels!中国首个接入大模型Linux开源操作系统正式发布!|AI日报
可信AI进展
2024/08/23
1940
最高分!腾讯云TI平台再获认可,助力企业构建高效低成本AI模型
近日,腾讯云在《Forrester Wave™:2023 年第四季度中国人工智能/机器学习平台》报告中被评为“强劲表现者”。腾讯云TI平台在训练工具、训练评估、推理目标、应用工具、定价灵活性和透明度以及路线图等六项标准中获得了最高分。根据Forrester报告,腾讯云旨在帮助客户构建低成本、高效满足业务需求的AI模型。
小腾资讯君
2023/10/24
4000
腾讯云发布三大AI大模型引擎,5分钟开发一款企业级知识应用
2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。
腾讯云AI
2024/05/20
1.7K0
腾讯云发布三大AI大模型引擎,5分钟开发一款企业级知识应用
瞄准B端!腾讯云推多款行业大模型解决方案,打造模型应用商店
6 月 19 日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,依托腾讯云 TI 平台打造行业大模型精选商店,为客户提供 MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。值得注意的是,此次腾讯云发布的大模型,主要瞄准的是 B 端市场。
深度学习与Python
2023/08/09
9020
瞄准B端!腾讯云推多款行业大模型解决方案,打造模型应用商店
腾讯云公布行业大模型最新进展
这是每家企业的关切。然而,面对算力昂贵、数据有限、经验缺乏、人才不足等等挑战,实际难度不小。
腾讯云TI平台
2023/07/25
1.1K0
腾讯云公布行业大模型最新进展
大模型进入「落地战」,腾讯云下手「行业」大模型
自 Bert 出现之后,大模型成为 AI 领域的主流技术趋势,业界也因此掀起两轮热潮。
机器之心
2023/08/07
4580
大模型进入「落地战」,腾讯云下手「行业」大模型
云厂PK算力够不够高, 客户只在意模型能否落地
从可以领会意图识别情绪的聊天机器人,到梦幻般的图像创作,再到复杂的 DNA 蛋白质建模……ChatGPT吸引了全世界的想象力,并且把数字经济带向了另一个历史性的节点。人工智能正在充当无形的虚拟行政助理,辅助保险理赔估算,甚至进行法律援助。
华尔街科技眼
2023/06/21
1910
腾讯云联合信通院发布《行业大模型标准体系及能力架构研究报告》
2023腾讯全球数字生态大会「行业大模型及智能应用专场」于9月7日举行,会上,腾讯云与信通院共同发布了《行业大模型标准体系及能力架构研究报告》,参考了腾讯云在行业大模型产业应用领域的实践和经验,为客户构建行业大模型提供了标准化流程、综合评估方法,以便更好地帮助行业伙伴构建专属大模型。
小腾资讯君
2023/09/25
1.7K0
腾讯云联合信通院发布《行业大模型标准体系及能力架构研究报告》
打通数据建设和应用!火山引擎提出数据飞轮,让数据驱动业务发展
大数据文摘出品 作者:Caleb 只有活的数据、真正被利用起来的数据,才是真正有价值的数据。 这是4月18日火山引擎总裁谭待在火山引擎FORCE原动力大会上所提出的观点。 这句话,也解释了数据中台争议之声愈演愈烈的原因。数据中台只是数据建设的一部分,汇集不同业务场景的数据,做好数据打通和统一的数据资产沉淀,并不能保证数据的价值得到有效发挥。 在谭待看来,要发挥好数据价值,一定要以数据消费为核心,让数据消费驱动业务应用,构建数据应用的闭环;通过数据消费驱动数据建设,有的放矢地建立数据平台。 这也是火山引擎结合
大数据文摘
2023/04/30
7320
打通数据建设和应用!火山引擎提出数据飞轮,让数据驱动业务发展
大模型之战,腾讯来了
9 月 7 日,腾讯在数字生态大会上正式推出混元大模型。据介绍,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
深度学习与Python
2023/09/18
3970
大模型之战,腾讯来了
国内首批丨腾讯云上架 Llama 3.1模型,支持在 TI 平台精调和推理
7月23日,Meta正式发布Llama 3.1 模型,包含8B、70B和405B 三种参数规模。其中405B 是目前最大开源模型之一,拥有4050 亿参数,支持多语言输入输出,在复杂数学和即时生成内容方面表现出色。
小腾资讯君
2024/07/24
3220
对标GPT-4o,腾讯混元再升级,大模型加速落地!
9月5日,腾讯宣布推出新一代大模型“腾讯混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。
腾讯云AI
2024/09/06
1930
对标GPT-4o,腾讯混元再升级,大模型加速落地!
从机器学习到推荐系统,技术平台全面统一:火山引擎已经发动
机器之心原创 作者:泽南 从自动驾驶到推荐系统,机器学习的开发现在都可以用统一的平台完成了。 不同机器学习任务,用统一的平台实现,速度成倍提升,GPU 调度 0 碎片,这是火山引擎最新开放的技术。 7 月 20 日,火山引擎 FORCE 原动力大会在北京举行。在活动中,品牌发布刚一年的火山引擎公布了一系列最新能力。 在 AI 方面,火山引擎推出了机器学习与智能推荐平台多云部署解决方案。据火山引擎机器学习系统负责人项亮介绍,字节跳动内部抖音、西瓜视频、飞书等不同业务的 AI 训练任务,都基于统一的训练平台提交
机器之心
2022/07/26
1.1K0
从机器学习到推荐系统,技术平台全面统一:火山引擎已经发动
推荐阅读
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
5320
火山引擎给大模型造大底座!MiniMax、智谱AI等已登陆
3100
大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘
3480
大模型时代需要什么样的安全水位?火山方舟首度公开「会话无痕」技术细节
940
抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%
9320
没有大招的火山引擎,拿下70%大模型玩家
3350
腾讯云MaaS再升级:混元筑底、生态扩容,持续推进“效能革命”
5550
豆包模型能力大幅提升,中国版Vision Pro正式发布!今年大模型市场份额第一还会是百度吗?|AI日报
1940
最高分!腾讯云TI平台再获认可,助力企业构建高效低成本AI模型
4000
腾讯云发布三大AI大模型引擎,5分钟开发一款企业级知识应用
1.7K0
瞄准B端!腾讯云推多款行业大模型解决方案,打造模型应用商店
9020
腾讯云公布行业大模型最新进展
1.1K0
大模型进入「落地战」,腾讯云下手「行业」大模型
4580
云厂PK算力够不够高, 客户只在意模型能否落地
1910
腾讯云联合信通院发布《行业大模型标准体系及能力架构研究报告》
1.7K0
打通数据建设和应用!火山引擎提出数据飞轮,让数据驱动业务发展
7320
大模型之战,腾讯来了
3970
国内首批丨腾讯云上架 Llama 3.1模型,支持在 TI 平台精调和推理
3220
对标GPT-4o,腾讯混元再升级,大模型加速落地!
1930
从机器学习到推荐系统,技术平台全面统一:火山引擎已经发动
1.1K0
相关推荐
抖音团队在用的大模型服务平台「火山方舟」,我们也上手体验了一把
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档