数据发现是 WeData 中面向全域数据资产的统一搜索与浏览入口。通过整合多种数据源中的元数据,为用户提供一个能够快速查找、理解和评估数据资产的平台级能力。用户可在数据治理页面单击数据资产,然后在左侧导航栏选择数据发现进入相应页面。

搜索框
数据发现页顶部为搜索框,您可以根据自己需求重新设定关键词搜索。在搜索框左侧,可以按照“数据表”“指标”进行搜索,也可以默认选择全部资产类型进行搜索。在搜索框旁,用户可以通过单击我的收藏进入我的收藏模块;单击最近浏览,展现最近的10条浏览记录,可以直接单击进入详情页。
搜索区域
数据发现页左侧为搜索区域,包含资产盘点中上架和未上架的所有资产,分成“数据表”和“指标”两个tab页。能够根据资产的数据源类型,数据源,数据库等条件,进一步细化搜索结果。
所有筛选项包括:资产目录、数据源类型、数据源、数据库、负责人、所属项目、资产等级、数仓分层、资产标签、资产状态、搜索范围。
搜索结果
搜索结果会按照匹配度对相关的数据资产进行排序。搜索结果包含数据表和指标两个tab页,数据表列表包括数据源类型、负责人、资产目录、标签、字段等信息,提供查看血缘,权限申请,收藏/取消收藏等功能;指标列表包含指标名称、描述、指标类型、负责人、资产目录等信息。
数据表搜索结果
根据匹配度,展示相应的数据表,搜索关键词会标黄。支持按照我负责的/我收藏的,对搜索结果进行筛选,同时支持按照表名排序,或者热度排序。
展示形式支持卡片视图和表格视图,默认展示卡片视图,单击卡片视图支持切换到“表格视图”,在设置中调整展现的字段方便进行查找和检视。在设置按钮中,可以按照偏好调整选择侧滑或者新窗口跳转。

指标搜索结果
根据匹配度进行指标搜索结果的展示,关键词会标黄。支持按照我负责的/我收藏的,对搜索结果进行筛选,同时支持按照表名排序,或者热度排序。
展示形式支持卡片视图和表格视图,默认展示卡片视图,单击卡片视图支持切换到“表格视图”,在设置中调整展现的字段方便进行查找和检视
单击表名和指标名,可以进入到表详情页和指标详情页。


表详情
说明:
由于不同数据源类型支持程度不一致,所以并不是所有类型都包含以下功能,请以页面实际展示结果为主。
在数据治理的各个功能相应的页面下,单击需要查看的表名即可进入表详情页面。根据数据源的不同,表详情页面包含了表的业务信息、技术信息、资产评分,基础信息、数据预览、产出与变更、数据血缘、数据温度、分区信息、数据质量、访问日志和使用说明。

业务信息
展示当前数据表的资产目录、标签、资产状态、重要等级、发布时间、所属项目、资产负责人和数仓分层。
业务信息可以在界面右上方“修改业务信息”打开弹窗进行修改调整。
技术信息
展示当前数据表的数据源类型、数据源、数据库、采集任务、引擎侧 Owner、引擎 ID、表类型、储存量、存储路径、生命周期、最近数据及 DDL 变更、创建时间和元数据来源。
资产评分
各项指标综合平均分,满分100,按天更新。

完善性:当前技术与业务信息的完善情况。
保障性:当前质量监控、访问控制情况。
及时性:近30天内数据按时产出情况。
稳定性:近30天内表结构变更情况。
规范性:暂未上线。
基础信息
提供编辑、查看 DDL 和查看 Select 功能,并展示字段名称、字段类型、字段描述、使用说明、安全等级和安全分类。

分区信息
分区信息包含了分区字段信息和分区的详细内容。

数据预览
预览该数据表内容,最多支持展示前5条数据,T+1更新数据。

产出与变更
产出信息:通过产出任务/实例时间进行筛选,展示任务 ID、第几次执行、计划调度时间、开始时间、产出时间、执行耗时和产出耗时。
变更信息:展示近30天内,表的变更记录,包括变更时间、变更类型、变更日志、操作人和影响表数。
血缘关系
WeData 血缘关系展示了主账号下所有项目内数据流转全链路,包括数据来源、去向、以及关联任务等。血缘关系功能提供了表/字段级血缘和影响分析,包含任务中使用的正式数据表的表间血缘。当前版本血缘关系功能支持同步任务、Hive SQL 任务血缘解析,主要覆盖 MySQL、Hive 两类表血缘。

血缘关系功能主要展示中心表/字段上下游数据流向和影响分析,默认仅展示中心表直接一级上下游表血缘,可在画布中进行血缘关系追溯、切换展示对象粒度等操作。主要功能及操作如下:
参数 | 说明 |
表血缘/字段血缘/影响分析 | 支持切换表/字段维度展示血缘关系 表血缘:以表为粒度展示表间上下游关系,画布中一个节点表示一张表。默认展示中心表直接一级上下游正式表血缘。 字段血缘:以字段为粒度对象展示表间某一字段的上下游关联字段,画布中一个节点表示一个字段。字段血缘默认以表的第一个字段作为中心。 影响分析:以当前表为核心,分析该表对任务和表的影响和依赖关系。 |
地图/层级模式 | 表血缘支持全表追溯/某一个单一链路追溯两种模式,默认按照地图模式追溯。 |
搜索 | 支持搜索画布中已经存在的表/字段,搜索后该对象将会在画布中居中展示。 |
画布工具:放大/缩小/还原/全屏 | 设置血缘画布及节点大小。 |
血缘画布 | 展示表/字段间血缘: ![]() 表/字段:画布中一个节点表示表/字段,默认以进入表详情页面的表作为画布中心表,该中心表左右两侧表示其关联上下游表/字段。 名称:表/字段名称,非中心表/字段可单击节点上方链接快速进入该表详情页面。 上游对象数:上游一级表/字段数量,若为0表示无上游。 下游对象数:下游一级表/字段数量,若为0表示无下游。 数据流向:箭头方向代表数据流动方向,左侧为来源数据,右侧为去向数据。 关联任务:单击箭头可查看产生此条数据血缘关联的同步/SQL 任务信息。 展开/收起:单击画布中节点上游/下游数字即可展开/收起该对象的上游/下游。若表/字段位于中心节点的下游,单击后仅展开其下游对象;反之,仅展开上游。 快捷展开:表血缘 > 地图模式下支持选择目标对象右键快捷展开上/下游多层级血缘。 |
表血缘
表血缘默认展示中心表直接一级上下游关联表数、上下游关联表、任务,支持选择目标表进行上/下游血缘追溯,一次展开所选表直接一级的全部上游/下游表,同级其他表血缘关系保持展开状态不变。

字段血缘
字段血缘以中心表的第一个字段作为初始化对象,默认展开该字段直接一级上下游关联量、上下游关联表、任务,支持选择目标字段进行上/下游血缘追溯。可单击画布左上侧的字段选择器切换展示字段。

影响分析
以当前表为核心,分析该表对任务和表的影响和依赖关系,以下为首次使用页面:

单击立即分析后,进入分析过程,该过程可能会持续数分钟至几十分钟。分析完成后,展示分析结果:

当前分析结果默认保留1个月,过期后重新分析即可。
受影响表(2):显示关联的数据表对象(如图中 default.cleanedcarsales)。
受影响任务(3):显示关联的数据处理任务(数据集成/SQL计算任务等)。
下载明细:单击下载明细导出 Excel 格式影响清单,包含影响表和任务。
重新分析:由于血缘是随着时间动态变化的,建议每次都重新分析以获取最新的影响结果。
系统自动标注“最近一次分析时间”(保留1个月历史)例:2025-07-18 17:43:06 需评估此时点后是否发生变更当前只支持下游影响分析。
当前约束:目前只支持分析下游影响。
数据温度
数据温度提供了温度趋势及频繁访问的任务信息。
温度趋势:近七天数据访问次数和表详情浏览次数。
频繁访问:近30天访问最频繁的任务(任务 ID、访问类型、任务状态、归属项目、所属工作流、责任人和次数)。

数据质量
数据质量提供数据表配置的质控规则,以及其输出的数据质量检测情况概览。

访问日志
访问日志提供数据表被访问情况的统计概览,包括访问日期、访问账号、任务 ID、访问类型、执行次数等信息。

使用说明
提供可编辑的页面,便于用户填写表的使用说明等业务信息。
数据库详情
进入数据资产> 我的数据> 我管理的界面,您可以找到您管理的数据库列表和数据库详情。同时,在治理中心>资产盘点 > 数据表页面,表的技术信息中将会展示此资产的数据库,单击即可查看该数据库详情。

数据库概要
数据库概要展示了该数据库下的总表数和总储存量。
基础信息
基础信息主要展示了数据源类型、关联数据源、采集任务、引擎 ID、归属项目、创建人和创建时间。单击采集任务的链接,即可跳转至对应采集任务的详情。
表列表
表列表主要展示了该数据库下所有数据表名称、负责人、重要等级、标签、资产目录、发布状态、存储量、以及其更新时间。单击表名后,将会跳转至表详情页面。
表列表同时支持资产盘点中的批量操作,例如,一键转交、批量修改资产目录、批量修改标签、批量修改重要等级、批量修改生命周期、收藏。
数据源详情
在治理中心 > 资产盘点 > 表详情页面,表的技术信息中将会展示此资产的数据源以及关联的数据源,单击即可查看该数据源详情。数据源详情页面包含了数据源概要、基础信息、以及源下所有的数据库和数据表。

数据源概要
数据源概要展示了该数据源下的总库数和总表数。
基础信息
基础信息主要展示了数据源名、数据源类型、引擎ID、创建人、创建时间、归属项目、授权项目、采集任务、同源采集任务等信息。同时,单击采集任务的链接可以跳转对应采集任务的详情。
库列表
库列表主要展示了该数据源下所有数据库名称,储存量以及其归属项目。您可以在此批量修改该数据源下数据库的归属项目。单击库名称后,将会跳转至该库的数据库详情页面。
表列表
表列表主要展示了该数据源下所有数据表名称、数据库名 .Schema、负责人、重要等级、标签、资产目录、发布状态、存储量、以及其更新时间。单击表名后,将会跳转至表详情页面。
表列表同时支持资产盘点中的批量操作,例如,一键转交、批量修改资产目录、批量修改标签、批量修改重要等级、批量修改生命周期、收藏。
