Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何快速搭建一个高可用的数据处理流水线?

如何快速搭建一个高可用的数据处理流水线?

作者头像
腾讯云serverless团队
发布于 2021-05-28 04:41:49
发布于 2021-05-28 04:41:49
1.3K0
举报

ASW 应用与服务编排工作流是腾讯云服务的编排工具,用户可以将多个云服务编排到业务场景相关的应用程序中,可以通过 ASW 工作流编排分布式任务,管理执行任务的顺序、错误处理、重试逻辑和状态,从而显著减轻团队的研发负担。

通过 ASW Map 并发能力编排调用云函数,完成批量数据的处理,并将结果写回存储,提供开箱即用、灵活便捷、高弹性高可用的数据处理系统模型。尤其适合证券交易数据统计,电商系统商品订单数据分析,微博热点分析等大数据分析场景。本文为您介绍如何使用 ASW 编排云函数,快速搭建一个高可用的数据处理流水线。

01.

ASW 工作流优势

  • 弹性高并发:工作流并发调用云函数可以快速调动大量计算资源加速数据处理。
  • 自定义流程:ASW 工作流可以实现高度自定义的工作流流程,例如数据处理流程、数据分析算法、数据存储方式。
  • 降低成本:数据处理是 CPU 密集型任务,在 ASW 工作流及云函数的资源利用率高的情况下,实现了成本的降低。
  • 提升效率:降低学习和使用成本,极大程度上缩短了项目周期,加快开发部署。

02.

系统架构

使用 ASW 创建编排云函数,先完成业务鉴权等预处理操作,然后通过 Map 并发函数读取数据,进行数据处理,将处理后的数据存储到云端数据库。同时,批量处理的数据可以直接给发送到图表与模型分析中。

03.

ASW 数据分析处理方案示例

《ASW 工作流最佳实践(二):使用 ASW 并发调用函数》文章中,使用 ASW 的 Map 节点能力进行并发的数据求和计算。本期将为您演示如何通过 ASW 工作流处理「一个并发获取多个微博用户信息」的完整数据分析流程。

应用部署后,将为您创建以下资源:

  • 云函数
  • dataProcess-getuserinfo-xxx 用于获取用户信息。
  • dataProcess-processUserInfo-xxx 用于处理用户信息,并把处理后的信息写到 cfs 文件下。
  • dataProcess-writeUserInfo-xxx 用于将cfs文件上传到cos中
  • VPC 私有网络:用于创建 CFS 文件系统
  • CFS 文件系统:用于将多次并发的函数处理数据写到同一个文件下。
  • COS 对象存储:用于存储最后的数据处理结果。
  • ASW 工作流:数据分析的工作流,其中每个节点将编排对应功能的云函数。
  • 运行角色:用于运行数据分析工作流。

1. 创建工作流

1.1 登录 ASW 应用与编排服务流控制台。在工作流页面,单击「新建」,进入创建工作流页面,单击「示例项目」,选择「数据分析处理」模板。

  • ASW 应用与编排服务流控制台:https://console.cloud.tencent.com/asw

1.2 单击「下一步」,在「配置基本信息」页面,您将会看到示例项目需要创建的资源,单击「开始部署」,等待资源创建成功,完成示例项目的部署。

2. 运行工作流

2.1 在工作流列表,单击「名称」链接进入工作流,您可以在界面中看到工作流的基本信息,单击「执行」下的「开始执行」 。

2.2 在弹出的「开始执行」窗口中,会有默认的输入参数,直接单击「确定」,运行工作流。

2.3 执行完成后,可以在详情页查看执行结果。滑动至页面最下方,在「执行历史记录」下,您可以查看子节点的运行情况。

2.4 单击「资源」中的云函数链接,可以直接跳到云函数控制台,查看函数执行详情。


识别下方 ? 二维码,即可加入腾讯云 ASW 交流群。


推荐阅读

One More Thing


欢迎进入千人 QQ 群 (871445853) 交流 Serverless!

  • GitHub: github.com/serverless
  • 官网: cloud.tencent.com/product/serverless-catalog

点击「阅读原文」,深入了解「腾讯云 ASW 工作流」产品服务。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ServerlessCloudNative 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何快速搭建一个 AI 识别处理的流水线?
本文为您介绍如何使用 ASW 编排云函数与 AI 产品服务,快速搭建一个 AI 智能识别的处理流水线。通过 ASW 编排调用腾讯云 AI 能力,完成 活体检测、语音识别、关键字采样、自动审核 等一系列自动化识别认证流程,提供开箱即用、灵活便捷、高弹性高可用的 AI 智能识别处理场景。 尤其适合社区人脸识别,金融交易人脸支付,智能线上开户等 AI 人工智能场景。 01. ASW 工作流 - 「AI 识别」系统架构 在「智能线上开户」的场景中,用户在应用客户端登录,客户端将用户视频采集后上传到 COS,通过
腾讯云serverless团队
2021/06/21
1.3K0
ASW 工作流最佳实践(二):使用 ASW 并发调用函数
在音视频转码、ETL 作业处理、基因数据处理等诸多场景中,我们都可以通过工作流并行调用云函数,将任务进行并行处理,大大提高任务处理的吞吐量,满足应用场景的高实时性、高并发能力。 在《使用 ASW 工作流创建您的第一个函数编排》文章中,我们分享了如何使用 ASW 编排一个 Sum 云函数进行求和计算。本期文章主要分享如何使用 ASW 的 Map 节点能力进行并发的数据求和计算。 01. 创建函数 1. 登录「云函数控制台」,创建一个函数名称为 Sum,运行环境为 Python 3.6 的云函数。 云函数控
腾讯云serverless团队
2021/05/18
7790
简单三步,通过工作流(ASW)快速完成订单数据处理
本文介绍如何通过工作流 ASW 编排云函数,快速完成订单数据的处理。 工作原理 工作流调用函数获取一定时间段内的订单数据,对数据进行预处理。 将预处理的数据交给 Map 迭代任务处理:每个订单进行数据处理后,分别写到不同的数据库表中,或者绘制成图表展示。 操作步骤 创建工作流程需要首先创建一个状态机,通过编排状态机的不同元件,改变状态机结构,从而实现用户自定义的功能集合。 简单三步即可完成:创建云函数 → 创建工作流 → 运行状态机 Step 1:创建云函数 a. 创建 GetOrder 函数 登录
腾讯云serverless团队
2021/02/02
8290
中台整合零售:腾讯电商业务中台的 Serverless 架构升级
零售领域变革不是一个新话题,从电商到 O2O ,从无人售货柜到机器人导购,腾讯云的尝试一直未曾止步。对于传统零售企业来说,通过数据中台可以让顾客与需求更好地匹配,同时实现平台上多触点获取流量。而技术中台,则可以帮助零售企业提升整体运营效率,在提高安全性的基础上,还能享受 AI 时代带来的智能化红利。 谈及腾讯电商业务中台,腾讯云应用与服务编排工作流 ASW 的项目负责人王子一认为,“以消费者为中心,实现上下游的产业协同,赋能商家,商家一次接入后,可应用于如下全部业务场景:检索业务、广告业务、智能广告投放、
腾讯云serverless团队
2022/01/25
2.4K0
连接人与万物,腾讯云 Serverless 助力打造更友好的世界
关注 TencentServerless 公众号,回复「PPT」,即可领取本届大会演讲 PPT。 Serverless 是继虚拟机、容器之后,第三代的通用计算技术,也是腾讯云战略级投入的技术赛道。Serverless 并不是一个新概念,在后疫情时代,我们看到 Serverless 技术正在加速落地,越来越多的企业希望通过新技术降本增效。本文由腾讯云 Serverless 产品总监张浩在 Techo TVP 开发者峰会 ServerlessDays China 2021 上的演讲《Let's Dive In
腾讯云serverless团队
2021/06/23
9930
发布更新|腾讯云 Serverless 产品动态 20210120
一、ASW 工作流公测发布 公测时间: 2021-01-22 产品背景: 应用与服务编排工作流(Application Services Workflow,以下简称:ASW)是按照业务场景对腾讯云服务进行可视化编排,组合成工作流模板的应用程序集成类产品,可以更简单、更直观、更快速地构建和更新应用。 产品功能: 支持云函数、视频处理 MPS、语音识别 ASR、自然语言处理 NLP、通用文字识别 General OCR 服务的编排能力 产品介绍: https://cloud.tencent.com/produ
腾讯云serverless团队
2021/01/21
1.1K0
ASW 工作流最佳实践(四):并行多任务处理
在数据处理、多媒体文件处理、商品审核、容器运维管理等系统架构中,往往需要并行多路任务处理的场景 。 例如电商商品审核系统,商家每天对商品进行管理更新后,商品数据需要通过商品中台进行一系列的审核操作:如 图片审核、死链检测、商品打标、文本审核、统一类目 等环节。海量更新的商品数据会先投递到 Ckafka,商品中台需要一个能快速处理大量数据,高并发、高吞吐量的数据处理流水线。 利用 ASW 低代码、灵活便捷的特性,通过 ASW + 云函数作为微服务的粘合剂,可快速搭建一个高效可用、易扩展性的微服务架构应用。A
腾讯云serverless团队
2021/06/03
1.2K0
Serverless 在数据处理场景下的最佳应用
我们知道传统的数据处理无外乎涉及 Kafka、Logstash、File Beats、Spark、Flink、CLS、COS 等组件。这些海量服务器组件承担着从数据源取数据,数据聚合过滤等处理,再到数据流转的任务,不管是开发成本、运维成本以及价格方面都有所欠佳。下面将为大家详细介绍:云函数 SCF 是如何降低传统海量服务器组件的开发和运维成本的。 01.  腾讯云云函数 SCF 腾讯云云函数(Serverless Cloud Function,SCF)是腾讯云为企业和开发者们提供的无服务器执行环境,在无需
腾讯云serverless团队
2021/04/15
7900
使用腾讯云Serverless快速架构和部署Z-BlogPHP博客
Z-BlogPHP 是由 Z-Blog 社区提供的博客程序,一直致力于给国内用户提供优秀的博客写作体验。从 2005 年起发布第一版,至今已有 16 年的历史,是目前国内为数不多的持续提供更新的开源 CMS 系统之一。Z-BlogPHP 支持PHP 5.2 - 7.4、8.0,可运行在市面上所有的操作系统和WEB服务器之上。数据库支持 MySQL 数据库(兼容 MariaDB),同时也支持更小巧方便的 SQLite 数据库,1.7版本也开始支持PostgreSQL数据库。
李洋博客
2021/11/08
9391
使用腾讯云Serverless快速架构和部署Z-BlogPHP博客
基于《2023腾讯云容器和函数计算技术实践精选集》—探索腾讯云TKE的Docker容器、Serverless和微服务优势
腾讯云TKE,全称Tencent Kubernetes Engine,是一种完全托管式的容器服务。它可以帮助用户快速、高效地部署和管理Kubernetes集群,并提供一系列与之相关的云服务,如负载均衡、云硬盘、对象存储等。本文基于《2023腾讯云容器和函数计算技术实践精选集》所写,这本实践精选集是深入探索云原生领域技术实践的书籍,它涵盖了Docker容器、Serverless、微服务、云原生架构等多个关键领域,为读者提供了丰富的技术知识和实践经验。
一键难忘
2024/04/01
3851
COS数据工作流+云函数最佳实践 - 自定义音视频转码
音视频作为信息传播中流量占比最大的部分在各行业的业务中都弥足重要,而不同的业务场景中对音视频的处理逻辑可能具备行业的特殊性。
云存储
2021/08/06
5420
技术架构解密 - 应用与服务编排工作流 ASW
腾讯云应用与服务编排工作流 ASW(Application Service Workflow)是新一代计算架构体系下的服务编排解决方案,用来协调分布式任务执行的编排产品。在应用与服务编排工作流中设定好任务执行步骤,可以将多个腾讯云服务按步骤进行调度,完成各种业务应用场景。能简化开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,更简单、更高效的构建应用。像胶水一样粘合云上各种产品和服务,提供面向用户场景的端到端解决方案。 01. 应用与服务编排工作流 ASW 背景介绍 随着云计算
腾讯云serverless团队
2021/07/14
2.1K0
COS 数据工作流 + Serverless云函数自定义处理能力发布!
在工业 4.0 的浪潮下,智能和数据与物理世界结合越加紧密,多元化、灵活、高效的数据处理能力成为各行各业的热点需求。虽然对象存储 COS 已经预置电商、文创、教育、社交、安防等行业需要的基础数据处理能力,但在特殊流程和定制化需求方面公有云依然难以做到全方位满足客户需求。 01. 数据工作流全新能力出炉: 支持自定义云函数 COS 数据工作流是一套完整的端到云到端的数据存储、处理、发布等「一站式」云上智能解决方案。 COS 数据工作流最新增加了自定义函数的处理能力,开发者可添加 Serverless 云函数
腾讯云serverless团队
2021/08/06
1.2K0
COS 数据工作流 + 云函数最佳实践 - 自定义音视频转码
音视频作为信息传播中流量占比最大的部分在各行业的业务中都弥足重要,而不同的业务场景中对音视频的处理逻辑可能具备行业的特殊性。公有云虽然提供大量的视频处理服务供用户选择,但依然不能做到全面覆盖用户的特殊流程及定制化需求。 使用 COS 工作流处理结合云函数 SCF 定制逻辑此时就是一个绝佳选择,帮助用户 快速创建满足需求的各种音视频处理服务。 01. 「COS 数据工作流 + 云函数」应用场景 1. 快速接入用户自建转码集群,兼容用户原有业务; 2. 支持行业特殊格式与处理逻辑,接入电影、安防等特殊行业
腾讯云serverless团队
2021/08/10
1.4K0
京东流水线——满足你对工作流编排的一切幻想
在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!
京东技术
2024/03/26
2150
京东流水线——满足你对工作流编排的一切幻想
使用 ASW 工作流创建您的第一个函数编排
应用与服务编排工作流(Application Services Workflow,ASW)是一个用来协调分布式任务执行的编排产品,根据腾讯云状态语言定义来编排分布式任务和服务,工作流会按照设定好的顺序可靠地协调执行,将云函数与多个腾讯云服务按步骤进行调度,通过低代码配置,就可以完成开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,让研发团队能更简单、更高效的构建与更新应用。 01. ASW 工作流与传统工作流的对比 特性 ASW 工作流传统工作流易用性已完成云服务集成, 方便调用云上资源
腾讯云serverless团队
2021/04/29
2.1K0
未来已来:从信通院 Serverless 标准,看无服务器发展趋势
“ 无服务器架构(Serverless)是一种将应用与基础设施彻底分离的架构理念,开发人员无需关心基础设施的运维工作,只需专注于应用逻辑的开发,真正实现了弹性伸缩与按需付费。当前各大云服务商和头部互联网企业的内部业务 Serverless 化升级改造已经开始小范围试水;中小企业基于 Serverless 的业务应用也初见端倪,已然可见初具规模的企业级应用,未来可期。Serverless 生态已初具规模,可以预见,Serverless 将成为下一代云计算服务形态的趋势。 ” 在此背景下,云函数(SCF)、弹
腾讯云serverless团队
2021/08/04
1.8K0
COS 数据工作流 + Serverless云函数自定义处理能力发布!
在工业4.0的浪潮下,智能和数据与物理世界结合越加紧密,多元化、灵活、高效的数据处理能力成为各行各业的热点需求。
云存储
2021/08/05
4210
COS 数据工作流 + Serverless云函数自定义处理能力发布!
业界首发!云函数 120G 超大内存规格实例
腾讯云 Serverless 云函数 SCF 现支持分配 120GB(122,880MB) 大内存环境,可以更加轻松地处理具有更高内存或更密集计算需求的工作负载,如音视频处理、大数据分析、大型文件处理、统计计算以及 AI 推理等多种场景。 01. 功能介绍 在腾讯云 Serverless 云函数资源模型中,可以选择用于函数的内存量,这会分配等比例的 CPU 计算能力和其他资源。意味着在选择新的较大设置时,可以使用更多计算能力。可以指定函数运行时可用的内存大小,最小 64MB ,最大 122,880MB(1
腾讯云serverless团队
2021/04/12
1.2K0
浅谈数据流水线
当下我们听过很多热门的技术名词,例如:机器学习模型、推荐系统、高管驾驶舱、BI等等,在这些技术背后一个关键的角色就是:数据。这些数据通常不是单一的,原始的数据,而是需要从多个数据源获取,并经过复杂的提取、清洗、处理、加工等过程才能最终提供真正的价值。我们常说“数据是未来的石油”,其实也就是在说,数据并不是“开采”出来就可以直接提供价值的,而是要经过若干流程的“加工”和“提纯”才可以产生价值。而对于数据的加工和处理流程,我们通常将其称为数据流水线,也就是 Data Pipeline。
ThoughtWorks
2021/09/15
5330
推荐阅读
相关推荐
如何快速搭建一个 AI 识别处理的流水线?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档