我正在努力实现360度的客户数据视图,我想将来自整个业务的多个系统的数据集中在一起。我希望这是一个广泛的问题,但通过创建数据仓库来实现这一点是唯一的方法吗?
谢谢
发布于 2017-02-13 12:37:48
答案是:视情况而定。
绝对最低要求是您能够从不同的源系统链接客户。
理论上,您可以创建一个桥接表,其中包含来自不同源系统的自然键(唯一In )作为列,使用某种匹配算法填充该表,并让报表平台处理数据的连接。
在实践中,除了最简单的系统之外,当您尝试这样做时,您将在所有的系统上遇到痛苦的世界:
建立datamart或数据仓库就是为了解决所有这些问题。您只需输入一次生产数据,而不是针对每个报表,清理和验证内容,将其转换为报表优化的表单,并以一致的方式将其呈现给最终用户。
如果您的360°视图集中于明确定义的事务/交互,特别是如果它们是相互关联的(即与最近购买的产品相关的支持票),那么投资时间来分析所有输入的数据并统一来自不同来源的类似数据的含义可能是唯一明智的选择。在数据仓库设计的ETL层中编写所有这些规则,不仅比将逻辑单独嵌入每个报表更具有性能,而且更易于维护。
如果你有一群数据科学家在运行他们自己的分析,不需要每次看到与最后一个数字相匹配的数字,那么你很可能可以将来自每个源系统的半结构化数据一起倾倒到一个NoSQL DB或类似的存储中,只有客户唯一的ID才能将它们联合起来。
https://stackoverflow.com/questions/42201265
复制相似问题