首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云助力火花思维成功升级高性能向量化计算引擎Meson

腾讯云助力火花思维成功升级高性能向量化计算引擎Meson

作者头像
腾讯QQ大数据
发布2025-10-20 18:42:54
发布2025-10-20 18:42:54
1210
举报

本文共计1369字 预计阅读时长5分钟

摘要

腾讯云高性能向量化计算引擎Meson助力火花思维成功实现无感加速Spark负载,复杂聚合任务性能提升2.67倍,性能提升结合弹性调度实现降本30%

业务背景

火花思维作为国内领先的在线教育平台,专注于儿童数理思维培养,其业务涵盖实时互动课程、个性化学习推荐、海量用户行为分析等场景。2024年10月火花思维完全迁移至腾讯云数据湖计算(DLC),实现大数据平台Serverless化。

随着业务复杂度提升,Spark架构在复杂查询中存在CPU利用率低、任务执行时间长等问题。面对2025年"成本优化30%"的战略目标,腾讯云大数据团队向火花思维推荐了腾讯云自主研发的Meson高性能向量化计算引擎,为SparkSQL工作负载和DataFrame API提供无感加速。

Meson高性能向量化计算引擎

腾讯云DLC产品于2024年10月上线 Meson高性能向量化计算引擎,为SparkSQL工作负载和DataFrame API提供无感加速,有效降低总成本。Meson 完全兼容Apache Spark API ,业务代码零改造。

Meson Spark的核心优势

  • 极致性能:基于C++构建,采用先进的Pipeline执行模型、向量化及自适应优化技术。核心算子(Join/Agg/Sort等)性能提升3~10倍,Scan Shuffle场景也有显著效果。在1TB TPC-DS测试中,性能达社区版Spark的 2.7倍 ,CPU消耗显著降低,瓶颈由CPU转向IO。
  • 无缝兼容:兼容Spark SQL及DataFrame API,提供算子级Fallback机制,迁移风险极低。
  • 产品化成熟:深度集成于DLC产品,提供开箱即用的上下游兼容与优化。

升级过程

Meson的Fallback机制虽保障兼容性,但过量Fallback(函数不兼容时回退至Spark原生执行)可能因跨语言内存拷贝带来额外开销,甚至导致作业负收益。因此,迁移前需确保整体兼容性达标。

腾讯云与火花思维共同制定了严谨的迁移流程

协助火花验证迁移过程中,Meson在兼容性、稳定性以及Fallback方面都遇到了工程化挑战,我们通过构建兼容性评估工具、内存优化以及主动Fallback等方式优化了作业迁移体验。

挑战1:未知兼容性问题拉长测试周期

业务双跑虽然能发现兼容性问题,但是会依赖客户侧配合,反复沟通导致兼容性测试周期拉长,项目周期不可控。

解决方案:打造Event log分析工具和Fallback Precheck插件帮助客户提前评估作业兼容性。

  • Event log分析:分析现集群日志,无需变更。基于event log解析SQL执行情况,产出函数的兼容性报告。
  • Precheck机制:已部署Meson的集群,无需业务改造或者业务双跑即评估兼容性情况。尝试将Spark physical plan转换为Native plan通过Event log输出Fallback的情况,最终使用Spark plan执行通过Event log分析函数、算子兼容性情况。

挑战2:物理内存占用过高

Meson Spark的架构下,Java和C++程序会共存,两者内存分配方式完全不同。虽然Meson通过MemoryManager对内存进行了逻辑层面的统一管理,但是两种语言共存还是会造成物理内存过高的占用。

解决方案:优化物理内存池降低RSS峰值,在火花业务场景下,最多降低了46%的RSS峰值。

挑战3:特定场景行为差异(如JSON函数)

Meson的JSON函数是SIMDJson实现的,在面对异常JSON数据的处理时,跟Spark的JSON函数行为可能会存在差异。

解决方案:提供作业级主动Fallback机制,允许客户在作业级别对特定函数主动触发Fallback,有效降低数据兼容性风险。

升级收益

历时2个月,火花思维成功迁3000+作业至Meson引擎,实现成本和性能协同收益:

  • 性能提升:复杂聚合任务耗时从40分钟降至15分钟以内,性能提升2.67倍
  • 成本优化:Meson带来的性能提升结合DLC弹性资源调度,实现整体成本降低30%

总结和展望

火花思维升级实践验证了Meson在复杂生产环境的可靠性。配套开发的Spark Event Log分析工具和兼容性预检插件,使兼容性评估效率提升80%。Meson下阶段将聚焦深度兼容性优化、算子性能极限突破、统一内存池架构升级和智能调优体系构建,持续打造高性能计算能力。

腾讯云DLC和EMR产品已助力多家客户通过Meson实现效能升级。点击文末“阅读原文”了解腾讯云Meson高性能向量化查询引擎,获得更高性能的Spark计算体验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档