KyleMeow

文章/答案/技术大牛

发布

LV2

全部文章

Flink SQL 算子生成固定 ID 的方法总结
运行图中的每个节点有自己的 ID，也可以有自己的状态（State）。当 Flink 做快照时，会保存算子 ID 和状态的对应关系。因此，我们从快照恢复作业时，如...
KyleMeow
腾讯云｜高级工程师 (已认证)
2023-06-142023-06-14 18:42:00
flink、流计算 Oceanus、sql
Flink REST API 的设计指南
Flink REST API 是 JobManager 提供的 HTTP 接口，用户可以通过 GET、POST 等 REST 定义的方法，请求获取作业、JobM...
KyleMeow
腾讯云｜高级工程师 (已认证)
2023-06-052023-06-05 21:40:57
flink、流计算 Oceanus、restful、异步编程
Flink TaskManager 内存管理机制介绍与调优总结
Flink 的新版内存管理机制，要追溯到 2020 年初发布的 Flink 1.10 版本。当时 Flink 社区为了实现三大目标：
KyleMeow
腾讯云｜高级工程师 (已认证)
2022-12-052022-12-05 18:56:33
流计算 Oceanus、flink
腾讯云 Oceanus 在 MySQL CDC Connector 的核心优化
Apache Flink 作为流计算引擎，需要持续从上游接收数据流，并向下游输出最新的计算结果。Connector 起到承上启下的作用：Source 负责与上游...
KyleMeow
腾讯云｜高级工程师 (已认证)
2022-11-292022-11-29 16:52:39
流计算 Oceanus、flink
Flink 非确定性更新（NDU）问题探索和规避
非确定性函数（Non-Deterministic Functions）一直是影响流处理系统状态匹配的梦魇。例如用户在定义源表时，某个虚拟列字段调用了 RAND(...
KyleMeow
腾讯云｜高级工程师 (已认证)
2022-11-242022-11-24 19:53:35
流计算 Oceanus
Flink JobManager 内存管理机制介绍与调优总结
我们知道，旧版本 Flink 的 JobManager 作为管理者，只承担着初始化和协调的任务，内存压力非常小，很少出现 OOM 等问题。
KyleMeow
腾讯云｜高级工程师 (已认证)
2022-06-172022-06-17 17:00:30
flink、流计算 Oceanus
Flink SQL 双表 JOIN 介绍与原理简析
Flink 作为流式数据处理框架的领跑者，在吞吐量、时延、准确型、容错性等方面都有优异的表现。在 API 方面，它为用户提供了较底层的 DataStream A...
KyleMeow
腾讯云｜高级工程师 (已认证)
2022-03-222022-03-22 20:21:11
flink、流计算 Oceanus
Log4j 远程代码执行漏洞对 Flink 的影响和修复方案
为了了解这个 CVE-2021-44228 漏洞的影响，首先需要掌握一些 Java 概念。RMI 全称为 Remote Method Invocation，是 ...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-12-202021-12-20 10:10:40
流计算 Oceanus、flink
【流计算 Oceanus】巧用 Flink 实现高性能 ClickHouse 实时数仓
Apache Flink 是流式计算处理领域的领跑者。它凭借易用、高吞吐、低延迟、丰富的算子和原生状态支持等优势，多方位领先同领域的开源竞品。
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-12-172021-12-17 19:22:37
流计算 Oceanus、腾讯云数据仓库 TCHouse-C、flink
检测 JVM 自身物理内存用量（RSS）的小技巧
Flink 的 TaskManager 进程运行在 JVM 上，目前流计算 Oceanus 容器给定的内存上限是 4GB，如果超用就会被管控服务执行 OOMKi...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-12-022021-12-02 21:56:54
流计算 Oceanus、flink
从一个诡异的 Bug 来看 Flink 快照和状态读取的流程
流计算 Oceanus 平台支持以 SQL 的方式提交作业，独享集群支持最新的 Flink 1.10 提供的新版 Blink Planner 语法。有一位客户写...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:52:15
流计算 Oceanus、flink
Spill-able Heap Keyed State Backend 设计概览
Flink 在流式数据处理方面的能力非常强大，尤其值得一提的是它对带状态的流计算作业的支持度。它支持 Operator 和 Keyed 两类状态存储结构，其中后...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:48:26
流计算 Oceanus、flink
主用户为子用户添加流计算 Oceanus 授权策略指南
流计算 Oceanus 的云 API 已经启用 CAM 服务级鉴权。默认情况下，所有主账号（也成为主用户）均有 QcloudOceanusFullAccess ...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:48:13
流计算 Oceanus、flink
Flink on RocksDB 参数调优指南
对于需要保存超大状态（远超于内存容量）的流计算场景来说，目前 RocksDB [1] 是 Flink 平台上官方实现的唯一选择。业界也有使用 Redis 等其他...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:47:58
流计算 Oceanus、flink
一次 Javac 编译速度缓慢的 JDK Bug 定位
Flink 提供了从 Tuple0 ~ Tuple25 的 Tuple 类供用户选择，顾名思义，每个 Tuple 对象分别可以存储 0 个 ~ 25 个任意类型...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:47:42
流计算 Oceanus、flink
Spillable StateBackend 之 HeapStatusMonitor 解析
Flink 社区的 Spillable Backend 特性，社区经过了大半年的开发，目前已经放出了预览版可供体验。
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:46:50
流计算 Oceanus、flink
Spillable StateBackend 之 SpillAndLoadManager 源码注解
在前文中，我们介绍了 Spillable Backend 及其 HeapStatusMonitor 的工作原理和不足。今天我们来看一下 Spillable Ba...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:46:36
流计算 Oceanus、flink
Flink SQL 自定义函数指南 - 以读取 GBK 编码的数据库为例
近期我们遇到了一位客户提出的问题：MySQL 建表时，数据库表定义的字符集是 latin1，里面的数据是以 GBK 编码的方式写入的。当 Flink 的 JDB...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:46:07
流计算 Oceanus、flink
Too old resource version 引起 Flink JobManager 崩溃的问题定位
近期接到客户反馈，某地域的作业不定期的出现 JobManager 崩溃重启的问题。具体现象如下：
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:45:50
流计算 Oceanus、flink
修复 Flink Kubernetes 资源分配慢兼谈如何贡献开源社区
近期我们发现 Kubernetes 环境下的 Flink 集群有个奇怪的现象：在算子并行度较大（例如超过 50）时，Flink 的 TaskManager 注册...
KyleMeow
腾讯云｜高级工程师 (已认证)
2021-09-292021-09-29 20:45:23
流计算 Oceanus、flink

12 下一页

个人简介

腾讯云 | 高级工程师
腾讯云｜高级工程师 (已认证)
腾讯云大数据基础产品组流计算产品开发
暂未填写技能专长
香港大学 | 计算机科学
http://www.kyledong.com
广东省 | 深圳市
加入社区时间：2018-01-03

个人成就

获得 214 次赞同
文章被阅读 177.2K 次
文章获得 6 次首页推荐

关注了：5关注者：166

KyleMeow

全部文章

Flink SQL 算子生成固定 ID 的方法总结

Flink REST API 的设计指南

Flink TaskManager 内存管理机制介绍与调优总结

腾讯云 Oceanus 在 MySQL CDC Connector 的核心优化

Flink 非确定性更新（NDU）问题探索和规避

Flink JobManager 内存管理机制介绍与调优总结

Flink SQL 双表 JOIN 介绍与原理简析

Log4j 远程代码执行漏洞对 Flink 的影响和修复方案

【流计算 Oceanus】巧用 Flink 实现高性能 ClickHouse 实时数仓

检测 JVM 自身物理内存用量（RSS）的小技巧

从一个诡异的 Bug 来看 Flink 快照和状态读取的流程

Spill-able Heap Keyed State Backend 设计概览

主用户为子用户添加流计算 Oceanus 授权策略指南

Flink on RocksDB 参数调优指南

一次 Javac 编译速度缓慢的 JDK Bug 定位

Spillable StateBackend 之 HeapStatusMonitor 解析

Spillable StateBackend 之 SpillAndLoadManager 源码注解

Flink SQL 自定义函数指南 - 以读取 GBK 编码的数据库为例

Too old resource version 引起 Flink JobManager 崩溃的问题定位

修复 Flink Kubernetes 资源分配慢兼谈如何贡献开源社区

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

KyleMeow

Flink SQL 算子生成固定 ID 的方法总结

Flink REST API 的设计指南

Flink TaskManager 内存管理机制介绍与调优总结

腾讯云 Oceanus 在 MySQL CDC Connector 的核心优化

Flink 非确定性更新（NDU）问题探索和规避

Flink JobManager 内存管理机制介绍与调优总结

Flink SQL 双表 JOIN 介绍与原理简析

Log4j 远程代码执行漏洞对 Flink 的影响和修复方案

【流计算 Oceanus】巧用 Flink 实现高性能 ClickHouse 实时数仓

检测 JVM 自身物理内存用量（RSS）的小技巧

从一个诡异的 Bug 来看 Flink 快照和状态读取的流程

Spill-able Heap Keyed State Backend 设计概览

主用户为子用户添加流计算 Oceanus 授权策略指南

Flink on RocksDB 参数调优指南

一次 Javac 编译速度缓慢的 JDK Bug 定位

Spillable StateBackend 之 HeapStatusMonitor 解析

Spillable StateBackend 之 SpillAndLoadManager 源码注解

Flink SQL 自定义函数指南 - 以读取 GBK 编码的数据库为例

Too old resource version 引起 Flink JobManager 崩溃的问题定位

修复 Flink Kubernetes 资源分配慢 兼谈如何贡献开源社区

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

修复 Flink Kubernetes 资源分配慢兼谈如何贡献开源社区