深入理解 Doris Compaction：提升查询性能的幕后功臣

数据极客圈

发布于 2025-07-31 15:53:35

6490

在 Doris 的数据存储与查询体系里，Compaction 是保障查询效率、优化存储的关键机制。如果你好奇 Doris 如何在高频写入后仍能高效响应查询，或是想解决数据版本膨胀带来的性能问题，这篇关于 Compaction 的深度解析值得收藏 👇

一、为什么需要 Compaction？

Doris 采用类 LSM - Tree 的存储结构，每次数据导入会生成新的 Rowset（可理解为数据版本片段），每个rowset由0到n个sgement组成。segment实际对应这个磁盘上的一个文件。单个sgement文件是有序的。

存储文件目录结构

随着导入操作增多，Rowset 数量不断累积，会引发两大核心问题：

（一）查询效率下降

查询时，Doris 需要对多个 Rowset 执行 “多路归并” 操作来整合结果。Rowset 数量越多，归并的路数就越多，查询耗时呈几何级增长。例如，若一个查询需要合并 10 个 Rowset，归并过程就像同时梳理 10 条杂乱的线，难度和耗时远大于合并 2 - 3 个 Rowset。

（二）存储成本上升

大量零散的 Rowset 会占用更多磁盘空间，还可能存储重叠和无效数据。比如多次导入同一范围的数据，会生成多个有重叠的 Rowset，不仅浪费存储，还会让查询时的归并逻辑更复杂。

Compaction 的核心目标

减少查询归并成本：将多个小 Rowset 合并为大 Rowset，降低查询时的合并路数。
消除无效数据：将标记删除（Delete）、更新（Update）的数据真正清理，避免查询时的无效扫描。
优化存储：在 Aggregate 模型中预聚合相同 Key 的数据，在 Unique 模型中保留最新版本，进一步提升查询效率。

compaction的粒度是tablet，下图是一个tablet compaction过程的示意图

tablet 的 compaction过程

二、Compaction 关键概念解析

1. Compaction Score：优先级调度指标

Compaction Score 是 Doris 判断 Tablet 做Compaction优先级的核心指标，值越高，优先级越高。

（一）本质

反映查询时 Rowset 参与 “多路归并” 的路数。路数越多，查询效率越低，越需要优先compaction。

（二）计算逻辑

遍历 Tablet 的 Rowset，根据其数据重叠情况统计归并路数：

若某 Tablet 的 Rowset 分布如下：

"rowsets": [
   "[0-100] 3 DATA NONOVERLAPPING ...", // 无重叠，归并占 1 路 
   "[101-101] 2 DATA OVERLAPPING ...",  // 有重叠，归并占 2 路 
   "[102-102] 1 DATA NONOVERLAPPING ..." // 无重叠，归并占 1 路 
]

无重叠 Rowset：如 [0-100] 范围的 Rowset 由 3 个Segment 组成，但是没有但是没有overlap，查询归并时仅占 1 路；
有重叠 Rowset：如 [101-101] 范围的 Rowset 由 2 个Segment 组成，但是有但是有overlap，查询归并时占 2 路。

则 Compaction Score = 1（第一行） + 2（第二行） + 1（第三行） = 4。

2. Base & Cumulative Compaction：分层合并策略

为了平衡 “压缩效率” 和 “数据合并成本”，Doris 采用分层压缩思路：

（1）Cumulative Compaction

作用：优先合并新写入的小 Rowset，避免直接与大 Rowset 合并导致效率低下。新导入的零散数据（如实时写入的小批次数据），先通过Cumulative Compaction逐步 “攒大”，减少后续 Base Compaction 的压力。

（2）Base Compaction

作用：当Cumulative Rowset 合并到一定规模后，再与 历史大 Rowset（Base Rowset）合并，最终形成更紧凑的大 Rowset，彻底优化查询路数。

（3）Cumulative Point：分层 “临界点”

用来划分 “Cumulative Rowset” 和 “Base Rowset” 的边界。比如某 Tablet 的 Cumulative Point 为 293，意味着：

compaction图

Rowset 范围 293+ 做的是 Cumulative Compaction；
Rowset 范围 0-292 做的是 Base Compaction。

三、Compaction 工作流程：生产者 - 消费者模式

Doris 的 Compaction 流程遵循生产者 - 消费者模型，可拆解为 4 大核心步骤，每个步骤都蕴含精细的设计逻辑：

1. 扫描与优先级计算（生产者线程）

BE 的 Compaction 生产者线程定时（可配置扫描间隔）扫描所有 Tablet，执行以下操作：

（一）计算 Compaction Score

遍历 Tablet 的 Rowset，统计每个 Rowset 在查询时的归并路数，累加得到 Compaction Score，确定compaction优先级。

（二）分层任务调度

Doris 通过轮询策略平衡 Base 和 Cumulative Compaction 的资源占用：

默认每 10 轮扫描选 1 次 Base Compaction 任务（处理历史大 Rowset 合并）；
其余 9 轮选 Cumulative Compaction 任务（快速合并新写入的小 Rowset ）。这样设计的原因是：Base Compaction 通常涉及更大数据量，资源消耗更高，需控制执行频率；而 Cumulative Compaction 处理小数据，可高频执行以快速优化查询。