随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI)、数据仓库、数据湖、数据中台等,这些概念特别容易混淆,本文对这些名词术语及内涵进行系统的解析,便于读者对数据平台相关的概念有全面的认识。
马云老师在2019年说了一段话,“很多人会把数据比作石油,我们现在搭建的数据中台,就是希望扮演发电厂的角色”,这一段话,现在被大众认为是“数据中台”这个概念的起源。
我们谈论数据中台之前,我们也听到过数据平台、数据仓库、数据湖的相关概念,它们都与数据有关系,但他们和数据中台有什么样的区别,下面我们将分别介绍数据平台数据仓库数据湖和数据中台。
光阴似箭,岁月如刀。小编已经从刚毕业时堤上看风的白衣少年,变成了一个有五年开发经验的半老程序员。五年——是一个非常重要的时间节点,意味你见过很多套技术构架,学过很多技术组件,写过很多行代码,有了自己的技术理解、知识体系和编码风格。这个时候我们对待技术的态度已经从扩宽广度,慢慢转变成沉淀深度为主了。
我对一些当下较为热门的概念做了一些梳理,其实想要了解区别,我觉得得先知道它们各自的定义。
数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据中台已成气候”……
关于数据中台的概念定义,业内有各种各样的版本,尤其是涉及数据中台与数据仓库、数据平台等相关概念的差异一直争议不断,可谓一百个人眼中,就有一百个数据中台,千百万人眼中,就有千百万个数据中台。关于概念之争论,笔者无意逐一罗列,更无意参与其中,而是希望从工程实践者的视角,提供一种全新的关于数据中台定义的思考逻辑。本章内容围绕数据中台的定义,采用两种方法,三个视角,给大家阐述,在工程实践者的眼中,数据中台的概念定义。
首先它不是一个平台,也不是一个系统,如果有厂商说他们有个数据中台卖给你,对不起,它是个骗子。
权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
现在各种新名词层出不穷,顶层的有数字城市、智慧地球、智慧城市、城市大脑;企业层面的有数字化转型、互联网经济,数字经济、数字平台; 平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱;技术层面的有数据仓库、数据集市、大数据平台、数据湖、数据中台、业务中台、技术中台等等,总之是你方唱罢他登场,各种概念满天飞…
导读:要建设数据中台,我们首先需要明确什么是数据中台,以及数据中台能为企业带来什么价值。
这种思想上的默契,在2019年被彻底打破了。来搅局的,正是耳熟能详、方兴未艾的“数据中台”。
数据中台的概念最是阿里提出来的是为了实现数据的分层和水平解耦,提供数据服务能力。看了那么多中台的概念,对中台也有些自己的理解。笔者认为中台主要是为了提供全域的数据服务。主要包括以下4部分:数据资产、数据治理、数据模型、数据服务。
作者 | 张雅文 当前,数字化转型已成为很多企业的必修课。而面对如今的经济形势,企业为数字化转型迈出的每一步都至关重要。过去,不少企业为充分发挥数据价值,已经做了很多相关努力,从以 Hadoop 为核心的数据湖,到 Snowflake、Databricks 等云上数据仓库,再到湖仓一体化...... 这些举措真的解决了与日俱增的数据问题吗?未必。今年 Gartner 发布的《分析查询加速的市场引导报告》就曾指出,企业在享受数据湖带来灵活性的同时,也承受着因数据使用和管理混乱带来的不利影响。 传统BI 已经无
目前,外界与业内很多人对于数据中台的理解存在误区,一直只是在强调技术的作用。为了统一大家的认知,更加清晰的认识数据中台出现的意义。本文将从数据平台进化演变的角度,对数据中台进行深入的介绍。
作者 | 松子(李博源) 策划 | Tina 编者按:《透过数字化转型再谈数据中台》系列连载 6-8 篇左右,作者结合自己在数据中台领域多年实践经验,总结了数据架构知识、BI 知识,以及分享给大家一些产业互联网实施经验。本文是系列文章中的第三篇。 在前面两篇 “关于数字化转型的几个见解 ”、“唯一性定理中的数据中台”提到了数据中台发展问题。比如概念发展太快,信息量过载,以及存在广义、狭义的数据中台定义的差别等,涉及到的这些知识都离不开数据架构的范畴,所以这一篇我会通过大数据架构发展的视角来总结与分享。(一些
如今,随着诸如互联网以及物联网等技术的不断发展,越来越多的数据被生产出来。据统计,每天大约有超过2.5亿亿字节的各种各样数据产生。这些数据需要被存储起来并且能够被方便的分析和利用。
首先,用于支持决策,面向分析型数据处理;其次,对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
来源:五分钟学大数据 本文约10000+字,建议阅读10+分钟 本文将从历史的角度对数据湖和数据仓库的来龙去脉进行深入剖析。 随着近几年数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台,各大云厂商也在纷纷的提出自己的数据湖解决方案,一些云数仓产品也增加了和数据湖联动的特性。 但是数据仓库和数据湖的区别到底是什么,是技术路线之争?是数据管理方式之争?二者是水火不容还是其实可以和谐共存,甚至互为补充? 本文作者来自阿里巴巴计算平台部门,深度参与阿里巴巴大数据/数
确实,如果从一个初学者来说这些技术可能大家听起来会很容易觉得混淆,他们到底是什么样的一些关系?我为大家去简单的梳理一下。
导读:随着近几年数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台,各大云厂商也在纷纷的提出自己的数据湖解决方案,一些云数仓产品也增加了和数据湖联动的特性。
作者简介:史凯,花名凯哥,腾讯云最具价值专家TVP,ThoughtWorks数据智能业务总经理。投身于企业数字化转型工作近20年。2000年初,在IBM 研发企业级中间件,接着加入埃森哲,为大型企业提供信息化架构规划,设计,ERP,云平台,数据仓库构建等技术咨询实施服务,随后在EMC负责企业应用转型业务,为企业提供云迁移,应用现代化服务。现在专注于企业智能化转型领域,是数据驱动的数字化转型的行业布道者,数据中台的推广者,精益数据创新体系的创始人,2019年荣获全球Data IQ 100人的数据赋能者称号,创业邦卓越生态聚合赋能官TOP 5。2019年度数字化转型专家奖。打造了行业第一个数据创新的数字化转型卡牌和工作坊。创建了精益数据创新方法论体系构建数据驱动的智能企业,并在多个企业验证成功,正在向国内外推广。
最近几年,数据中台概念的热度一直不减。2018 年起,马蜂窝也开始了自己的数据中台探索之路。
导读:元数据管理是企业数据治理的基础,是数据仓库的提升。作为一名数据人,首要任务就是理解元数据管理。
引言 在本系列的前面两篇文章(《数据智能时代来临:本质及技术体系要求》和《多维度分析系统的选型方法》)之中,我们概括性地阐述了对于数据智能的理解,并根据工作中团队涉及到的多维度分析系统的选型方法进行了穿插介绍。按照原先的规划,我们接下去的内容会涉及数据智能平台中的治理、安全计算以及质量保证方面。
在前面两篇文章(《数据智能时代来临:本质及技术体系要求》和《多维度分析系统的选型方法》)之中,我们概括性地阐述了对于数据智能的理解,并根据工作中团队涉及到的多维度分析系统的选型方法进行了穿插介绍。按照原先的规划,我们接下去的内容会涉及数据智能平台中的治理、安全计算以及质量保证方面。
大家好,我是一哥,元数据管理是企业数据治理的基础,是数据仓库建设的关键。作为一名数据人,首要任务就是理解元数据管理。
导语 | 数据中台被誉为大数据的下一站,成为了人们谈论的焦点,2019年也被称为数据中台元年。但是数据中台是什么?它和数据仓库、商业智能、大数据平台有什么区别?它的主要功能是什么?本文是对TVP史凯老师的直播演讲整理,为大家剖析数据中台的愿景和本质。「TVP思享」专栏,凝结大咖思考,汇聚专家分享,收获全新思想,欢迎长期关注。(编辑:云加社区 涛涛)
横向规划即在数据中台规划初期,需要打通企业各个业务系,打破数据孤岛现象。其实就是我们建设数据仓库的阶段。比如电信业务,我们要把客户、账务、客服、营销等业务板块打通数据,全盘考虑,融通数据形成数据资产。
我们在谈数仓之前,为了让大家有直观的认识,先来谈数仓架构,“架构”是什么?这个问题从来就没有一个准确的答案。这里我们引用一段话:在软件行业,一种被普遍接受的架构定义是指系统的一个或多个结构。结构中包括软件的构建(构建是指软件的设计与实现),构建的外部可以看到属性以及它们之间的相互关系。
抗击疫情,腾讯云在行动。数据中台被誉为大数据的下一站,成为了人们谈论的焦点,2019年也被称为数据中台元年。但是数据中台是什么?它和数据仓库、商业智能、大数据平台有什么区别?它的主要功能是什么?本文是对TVP史凯老师的直播演讲整理,为大家剖析数据中台的愿景和本质。
说到数据库,我们一般是指传统的关系型数据库,也就是“联机事务处理”(OLTP),主要用户在线交易处理。比如银行业务、电信业务之前很多都是Oracle或者DB2(可能现在很多开发者没再用过),到后来的互联网电商用的MySql,这些都是关系型数据库。
作者简介:6年大数据开发经验,从毕业一直从事大数据开发工作,渣渣二本,凭借自己努力进入一线互联网企业,目前负责实时计算开发工作。最近看到大家对互联网词汇特别迷,我就写一篇文章来给大家讲讲,好久没有写原创了,主要是平时太忙了,没时间写。
而数据中台则是将数据服务化之后提供给业务系统, 目标是将数据能力渗透到各个业务环节
自从阿里提出了“大中台,小前台”概念之后,这几年数据中台这个概念火了起来,互联网巨头们纷纷搭建起了自家的数据中台,究竟数据中台有什么魅力,能让企业如此重视?
公司经营分析会提到家庭市场的重要性,我就问负责家庭模型的同事:去年做的家庭结构标签用得怎么样?然后同事给我拉出了下面这张表。
为什么要数据仓库建模呢? 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。 数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。Linux的创始人Torvalds有一段关于“什么才是优秀程序员”的话:“烂程序员关心的是代码,好程序员关心的是数据结构和它们之间的关系”,最能够说明数据模型
本文来源于A94大佬的关于数据仓库分享,如果感兴趣兴趣可以登录B站自行查看,在此给出链接地址:857数据交流技术峰会之数仓篇
当我们谈中台与微服务的区别时,更多谈的是业务中台;当我们谈中台与中间件的区别时,则更倾向于技术中台;当我们谈中台与数据仓库的区别时,更多谈的则是数据中台。
MPP代表"Massively Parallel Processing",是一种计算机架构,旨在通过分布式处理来实现大规模数据处理和分析。它使用多个处理器或计算节点同时工作,以加快数据处理速度和提高性能。MPP架构通常用于处理海量数据的应用程序,如数据仓库、商业智能和大数据分析。
在大数据时代,大家都意识到数据已经成为了公司宝贵的资产,但如何让数据发挥价值,一直困扰着大家。数据技术人员需要长时间去理解某一个业务,业务人员也很难使用现代化数据分析工具赋能业务。那么,如何让公司数据能够快速和业务融合起来成为了广大数据从业者和数据服务厂家一直以来思考的问题。
数据是从业务系统产生的,而业务系统也需要数据分析的结果,那么是否可以把业务系统的数据存储和计算能力抽离,由单独的数据处理平台提供存储和计算能力,不仅可以简化业务系统的复杂性,而且可以让各个系统采用更合适的技术,专注做本身擅长的事?这个专用的数据处理平台即数据中台。
领取专属 10元无门槛券
手把手带您无忧上云