本章节的语义建模重点指指标建模。ER建模需单独购买,如有需要,可联系销售人员咨询。
指标建模的价值
1. 统一业务口径
业务口径不统一是企业数据应用的常见障碍,指标建模通过以下方式解决这一问题:
固化定义标准:将 “GMV”“活跃用户” 等关键指标的统计逻辑、时间范围、维度划分等写入模型,确保所有部门使用同一套定义。例如,明确 “活跃用户” 需满足 “打开 APP 且停留超 30 秒”,避免运营和财务各有解读。
减少人为偏差:避免因提数人员不同、工具不同导致的计算差异。模型一旦发布,所有基于该模型的报表、分析都会自动沿用统一逻辑,无需人工重复确认。
降低沟通成本:业务部门讨论数据时,无需再花时间对齐 “这个指标怎么算的”,可直接聚焦于数据背后的业务问题,提升决策效率。
2. 赋能Agent智能问数,提升数据准确度
在 AI 驱动的智能问数场景中,指标建模是 Agent 准确理解需求、输出结果的基础,具体价值体现在:
让 Agent “读懂” 业务:指标模型中包含的业务逻辑(如 “复购率 = 30 天内再次下单用户数 / 总下单用户数”),能帮助 Agent 精准解析自然语言需求(如 “上个月的复购率是多少”),避免理解偏差。
直接调用可信计算逻辑:Agent 无需临时拼接 SQL 或依赖人工配置,可直接调用模型中预定义的、经过验证的计算规则,大幅降低因逻辑错误导致的数据不准确问题。
提升问数响应速度:用户通过 Agent 提问后,系统可基于指标模型快速生成结果,无需等待数据分析师处理,实现 “秒级提数”,满足业务实时决策需求。
指标建模产品架构

指标建模中的关键概念
分析模型
通过共有标识(如用户 ID、订单号、商品编码等)建立数据之间的关联规则,让原本独立的表(或数据集)产生逻辑连接。例如,“用户表”(含用户 ID、姓名)和 “订单表”(含用户 ID、订单金额)可通过 “用户 ID” JOIN,从而得到 “每个用户的订单消费情况”。
原子指标
原子指标是指标的 “最小不可拆分单元”,是对业务事实的最基础量化描述。它仅包含核心业务含义,不附带任何维度、时间或业务限定条件。常见例子包括 “销售额”“用户数”“订单量”。
维度
维度是用于 “切片分析指标” 的角度,决定了指标的观察维度和聚合粒度。是对原子指标进行分类、筛选、分组的依据,帮助业务从不同视角解读数据。常见维度包括 “时间维度”(年 / 月 / 日)、“字典维度”(商品类别 / 用户等级)、“普通维度”(客户名称 / 代理商名称)。例如,将 “销售额” 按 “商品类别” 维度拆分,可得到不同类别的销售表现。
业务限定
业务限定是对指标统计范围的 “条件约束”,用于精准圈定业务场景。它通过添加过滤条件,排除无关数据,确保指标统计结果符合特定业务需求。例如,对 “用户数” 添加 “注册渠道 = APP Store” 的业务限定,得到的就是 “APP Store 渠道注册用户数”;添加 “支付方式 = 微信支付” 的限定,可聚焦微信支付相关的业务数据。
统计周期
统计周期是指标计算的 “时间范围”,决定了指标的时间粒度。它明确了指标是基于哪个时间段的数据进行统计,是指标可用性的关键要素。常见统计周期包括 “近7日”“当月”“本季度”,例如 “近7日销售额” 统计近7天数据,“本季度活跃用户数” 统计当季符合条件的用户总数。
指标时间标识
指标时间标识是 “确定指标统计时间基准” 的规则,避免时间维度的统计偏差。它主要解决 “按哪个时间字段统计” 的问题,确保不同场景下时间维度的一致性。例如,“订单金额” 可按 “订单创建时间” 统计(反映下单时间),也可按 “订单支付时间” 统计(反映支付时间),指标时间标识会明确选择其中一个作为基准。
衍生指标
衍生指标是基于原子指标 “计算得到的复合指标”,用于满足更复杂的业务分析需求。衍生指标=原子指标+业务限定+统计周期+衍生逻辑(如同比、环比、转化率/值、混合运算等)。它通过对一个或多个原子指标进行加减乘除等运算生成,能更深入地反映业务本质。常见例子包括 “客单价”(衍生自 “销售额 / 订单量”)、“复购率”(衍生自 “复购用户数 / 总购买用户数”)、“毛利率”(衍生自 “(销售额 - 成本)/ 销售额”)。
指标建模功能清单
功能大类 | 功能子类 | 功能描述 |
指标管理 | 指标定义 | 1. 基础属性:指标名称/编码、创建人、创建时间、指标状态、更新人、更新时间等。 2. 业务属性:业务负责人、技术负责人、重要等级、资产目录等。 3. 口径&计算逻辑:指标业务口径、技术口径、关联维度模型、计算逻辑、分析维度、业务限定等。 |
| 指标管理 | 指标新建、编辑、发布上线、下线和删除;并支持指标发布、下线场景审批流程管理 |
| 指标发现 | 支持原子、衍生指标的检索,以及指标详情查看,包含指标详情口径、指标服务、指标分析、指标血缘,以及指标调用权限申请、审批。 |
| 指标服务 | 支持 Restful API、JDBC 和 MCP 指标服务接口 |
| 指标分析 | 支持用户在指标详情页面,通过可视化UI,灵活设置时间范围、分析维度、过滤条件等信息,即时查询指标计算结果。 |
| 指标血缘 | 支持查看指标全链路血缘 |
模型管理 | 模型定义 | 1. 可视化托拉拽配置维表与事实表之间的映射关系。 2. 配置模型可支持的分析维度,含维度名、编码、维度类型(字典维度、时间维度、普通维度)。 3. 支持 StarRocks、TCHouse-D、Doris 数据源类型。 |
| 模型管理 | 模型新建、编辑、发布上线、下线和删除 |
维度管理 | 维度管理 | 管理项目内所有维度列表,包含创建、编辑和删除维度,设置维度英文名、维度别名、维度描述、维度类型、维度关联的字典以及时间维度的最小粒度等信息。 |