近日,微软推出了微软 Fabric 国际版——一个端到端的统一数据分析平台,汇集了企业需要的所有数据和分析工具。Fabric 将 Azure 数据工厂、Azure Synapse Analytics 和 Power BI 等技术集成到一个统一的产品中,能够让数据和业务专员更好地发掘、探索企业的数据,也为人工智能时代的到来奠定了基础。
人类正在进入由人工智能定义的新时代,数据的重要性愈发不言而喻。人工智能的应用正在融入工作中的方方面面,重新定义工作方式,这更需要纯净的数据与高度集成的分析系统进行支撑。然而,大多数企业正在使用的数据分析系统却像迷宫一样复杂。
这并不令人意外,因为大数据和人工智能技术市场高度分散,拥有数百个供应商和成千上万种服务。客户需要自行整合这些来自不同供应商的、彼此独立的服务,还要承担让这些服务协同运行的成本。
Fabric 是一个端到端的分析平台,涵盖了组织在数据分析中各个方面的需求。而下面这五个方面的特点,让 Fabric 在市场中脱颖而出:
每个分析项目都有多个子系统,每个子系统需要不同的能力组合,通常需要使用来自多个供应商的产品。集成这些产品的过程可能会非常复杂、不稳定且昂贵。
有了 Fabric,客户只需要使用这一款产品,它具有一体化的用户体验和架构,提供了开发人员从数据中提取有价值信息并最终呈现给用户所需要的所有功能。通过自动集成和优化所有内容,提供独特的用户体验,用户只需用几秒钟注册,就可以体验其中蕴含的商业价值。
Fabric 为不同角色的团队成员提供了符合其需求的特定体验,因此无论是数据工程师、数据仓库专员、数据科学家、数据分析师、还是业务用户,都能得心应手地使用 Fabric。
数据湖非常混乱且复杂,用户难以创建、整合、管理和操作。而且,一旦数据湖开始运行,使用不同数据格式的不同数据产品部署在同一个数据湖中,可能会导致严重数据重复以及企业对供应商的依赖。
OneLake 数据的 Onedrive
Fabric 内置了一款叫做 OneLake 的多云数据湖,所有 Fabric 都可直接使用。所有 Fabric 的工作都会自动与 OneLake 连接,就像所有的 Microsoft 365 应用程序与 OneDrive 连接一样。数据会在一个直观的数据中心进行组织,并自动建立索引,以供发现、共享、治理和进行合规性管理。
OneLake 同时为开发人员、业务分析师和业务用户提供服务,有助于消除因为不同开发人员自行配置和管理自己的独立存储账户而造成的数据孤岛现象。OneLake 为所有开发人员提供了一个单一、统一的存储系统,在该系统中,数据的发现和共享会变得更容易,并可以通过集中执行的策略和安全设置来管理。
OneLake 的一个关键功能是“快捷方式(Shortcuts)”。OneLake 允许用户和应用程序在不必要地移动和复制信息的情况下轻松共享数据。快捷方式使得 OneLake 可以在 ADLSg2、Amazon Simple Storage Service (Amazon S3)和 Google Storage(即将推出)中虚拟化数据湖存储,使开发人员能够跨云平台组合和分析数据。
采用开放的数据格式进行分析
Fabric 在所有的工作和层面上都致力于采用开放的数据格式。Fabric 将 Delta 和 Parquet 文件视为原生数据格式,并将其作为所有工作的默认格式。这种对共同开放数据格式的坚持意味着客户只需将数据加载到数据湖中一次,所有的工作都可以在同一份数据上操作,而不需要单独导入数据。这也意味着 OneLake 支持任何格式的结构化数据和非结构化数据,为客户提供了灵活的选择。
通过将 OneLake 作为我们的存储系统,并将 Delta 和 Parquet 作为所有工作的通用格式,我们为客户提供了在最基本层面上统一的数据堆栈。客户不需要为数据库、数据湖、数据仓库、商业智能或实时分析维护不同的数据副本。相反,在 OneLake 中只需要维护一份数据副本,就可以直接为所有工作提供支持。
对于客户来说,在不同数据引擎之间管理数据安全(表级、列级和行级)可能会很痛苦。Fabric 提供了一个通用的安全模型,该模型在 OneLake 中进行管理,并且所有引擎在处理查询和作业时会统一执行这个模型。这一模型即将发布。
Fabric 在各个层面都融入了 Azure OpenAI 服务,旨在帮助客户充分发掘其数据的潜力,使开发人员能够利用人工智能技术对其数据进行分析,并帮助业务用户深入了解数据。在 Fabric 的数据体验中,通过 Copilot,用户可以使用对话式语言来创建数据流和数据管道、生成代码和完整的函数、构建机器学习模型或可视化结果。客户甚至可以创建自己的对话式语言体验,将 Azure OpenAI 服务模型与其数据相结合,并将其作为插件发布。
Fabric 的 Copilot 建立在我们对企业数据安全和隐私的现有承诺的基础上。Copilot 会集成组织的安全、合规和隐私政策。微软承诺不会使用用户数据来训练支持 Copilot 的基础语言模型。
客户希望在企业中建立数据文化,使每个人都能基于数据做出更好的决策。为了帮助客户培养这种文化,Fabric 与人们每天都使用的 Microsoft 365 应用程序进行了深度集成。
Power BI 是 Fabric 的核心组成部分,并已经在 Microsoft 365 中广泛应用。通过 Power BI 与诸如 Excel、Microsoft Teams、PowerPoint 和 SharePoint 等流行应用程序的深度集成,用户可以轻松地从 Microsoft 365 中发现和访问来自 OneLake 的相关数据,帮助客户从数据中获得更多的价值。这样的集成使用户能够在他们已经熟练使用的 Microsoft 365 工具中直接访问和分析数据,提高了数据的可发现性和可用性,帮助客户充分发挥数据的潜力,从而推动其业务获得更大的价值。
目前的分析系统通常会将来自多个供应商的产品组合在一个项目中。这导致计算的资源在数据集成、数据工程、数据仓库和商业智能等多个系统中进行分配。当其中一个系统处于空闲状态时,其算力无法被其他系统利用,从而造成了巨大的资源浪费。
Fabric 极大地简化了购买和管理资源。客户可以购买一种能够为所有 Fabric 工作供能的算力池。采用这种全包的方式,客户可以自由地创建解决方案,整合各种工作,而不需要面临复杂的集成或协调问题。统一的算力容量大大降低了成本,因为任何一个工作负载中未使用的算力都可以被其他工作负载利用。这种统一容量的使用方式使资源的利用更加高效,从而最大程度地降低了成本。
Fabric 目前处于海外版预览阶段。用户可以通过注册免费试用 Fabric 海外版来体验 所有功能。每个注册用户都可以获得固定的 Fabric 试用容量,可用于集成数据、创建机器学习模型等任何功能。现有的 Power BI Premium 客户可以通过 Power BI 管理门户启用 Fabric。2023 年 7 月 1 日后,Fabric 将对所有 Power BI 租户启用。
领取专属 10元无门槛券
私享最新 技术干货