首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据湖

#数据湖

数据湖是一个集中式存储池,可对接多种数据源,无缝对接各种计算分析和机器学习平台

腾讯云首发大数据高性能计算引擎Meson,支持三大产品线性能升级

腾讯QQ大数据

目前, Meson 已登陆腾讯云数据湖、检索分析服务、云数据仓库三大业务线,为企业在湖仓一体分析、向量检索、海量数据离线计算等业务场景带来卓越的性能表现。

900

Apache Hudi - 我们需要的开放数据湖仓一体平台

ApacheHudi

毋庸置疑,Hudi 是一个非常成功和有影响力的开源项目,它已经为许多公司提供了 7+ 年,在云上管理多个 EB。但考虑到我们所处的位置以及市场上人为的双头垄断叙...

15310

数据湖在快手的应用实践

ApacheHudi

导读 本文将分享数据湖在快手的应用实践。文章从业务使用方的视角,全面回顾了数据湖(Hudi)在快手内部的应用推广历程,给业务开发带来的效率提升和成本优化,以及在...

10610

国内顶级汽车制造厂的创新实践:如何利用实时数据湖为更多业务提供新鲜数据?

Tapdata

充分考虑到影响自身 IT 生产力发展的主要原因,该车企考虑采纳新一代实时数据湖方案,用于实时接收、存储和处理来自多个数据源的数据存储系统。与传统数据湖不同,实时...

6310

Apache Paimon要赢了?湖仓一体实时化时代全面开启!

王知无-import_bigdata

摘要:本文整理自阿里云开源大数据平台负责人王峰(莫问)老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享,主要介...

33910

基于 XTable 的 Dremio Lakehouse分析

ApacheHudi

如今,数据湖仓一体架构正变得无处不在,组织越来越多地采用开放表格式,例如 Apache Hudi、Apache Iceberg 和 Delta Lake 用于其...

9110

GenAI技术栈架构指南—10 个工具

云云众生s

现代数据湖,有时称为数据湖仓,一半是数据湖,一半是基于开放表格式规范 (OTF) 的数据仓库。两者都建立在现代对象存储之上。

16210

软考高级架构师:通俗讲解信息系统数据库、数据仓库和数据湖

明明如月学长

想象你走进一家大型超市,看到的第一样东西就是排列整齐的货架,上面摆放着各种商品,每种商品都有固定的位置,比如牛奶放在冷藏区,饼干放在干货区。数据库就相当于这些货...

6000

软考高级:数据库、数据仓库和数据湖概念和例题

明明如月学长

数据库、数据仓库和数据湖是数据管理系统中常见的三种概念,它们在存储结构、处理数据的方式、用途等方面各有特点。以下是对这三个概念的简要讲解:

4900

腾讯云数据湖赋能AIGC多模态大模型

云存储

腾讯云 · 云存储 (已认证)

近日,腾讯云存储解决方案总监温涛受邀在2024数据基础设施技术峰会-“智算中心技术创新论坛”分享了腾讯云的数据智能生态创新之路,剖析腾讯云数据湖在赋能AIGC多...

12300

查收一份来自南极的Iceberg数据治理指南

腾讯QQ大数据

Apache Iceberg 作为面向超大型湖存储的新一代表格式,由于在元数据管理、数据时效性以及解决传统Hive在海量分区操作耗时方面具备显著优势,目前正在被...

18110

数据湖Delta Lake、Hudi 与 Iceberg介绍 | 青训营笔记

鳄鱼儿

数据湖是一类存储数据自然/原始格式的系统或存储,通常是对象块或者文件。数据湖通常是企业中全量数据的单一存储。 全量数据包括原始系统所产生的原始数据拷贝以及为了各...

31010

有图有真相!深度剖析数据湖与数据仓库有什么区别

SNP数据迁移

从本质上说,数据湖就是一个信息资源库。人们常常将数据湖与数据仓库混为一谈,但两者在架构和满足的业务需求上都不一样。尤其是,随着社交媒体数据、物联网机器数据和交易...

28410

腾讯云大数据TBDS数据湖荣获IDC金融领域最佳实践案例

腾讯QQ大数据

国际权威市场研究机构IDC近日发布了《IDC PeerScape:金融领域中数据管理分析服务最佳实践案例》报告,腾讯云大数据TBDS和某股份制银行的存算分离数据...

28110

揭秘Robinhood扩展和管理PB级规模Lakehouse架构

ApacheHudi

Robinhood 团队成员高级工程师 Balaji Varadarajan 和技术主管 Pritam Dey 描述了他们公司的数据Lakehouse的实现,R...

12210

现代数据技术栈:反向ETL

大数据学习与分享

反向 ETL 是将数据从数据仓库或数据湖移回到操作系统、应用程序或其他数据源的过程。“反向 ETL”一词可能看起来令人困惑,因为传统的 ETL(提取、转换、加载...

10710

腾讯云存储亮相2024数据基础设施技术峰会·4.24成都站

云存储

腾讯云 · 云存储 (已认证)

温涛,腾讯云存储解决方案总监,受邀出席本次活动,将于智算中心技术创新论坛分享“数据智能生态创新之路,腾讯云数据湖赋能AIGC多模态大模型”的主题演讲,期待你的光...

15010

Apache Hudi +MinIO + HMS构建现代数据湖

ApacheHudi

Apache Hudi 已成为管理现代数据湖的领先开放表格式之一,直接在现代数据湖中提供核心仓库和数据库功能。这在很大程度上是由于 Hudi 提供了高级功能,例...

15210

什么数据集成(Data Integration):如何将业务数据集成到云平台?

SNP数据迁移

说到数据集成(Data Integration),简单地将所有数据倒入数据湖并不是解决办法。 在这篇文章中,我们将介绍如何轻松集成数据、链接不同来源的数据、将其...

32310
领券