腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Kappa
体系
结构是否使用
数据
湖
?
、
、
、
、
Kukreja在“Apache、Delta
湖
和Lakehouse的
数据
工程”中说,Kappa
体系
结构没有
数据
湖
。微软在 (见图)中提到了一家“长期商店”,但没有透露它的实际情况。它使用这些
数据
来“重新计算”。对我来说,这是一个
数据
湖
。
浏览 10
提问于2022-07-21
得票数 0
回答已采纳
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和
数据
<
浏览 8
提问于2016-03-14
得票数 16
1
回答
如果我通过enduser/承租者分割我的微服务
数据
,并且每个服务器都拥有全部
数据
的一个子集,那么如何在所有服务器上查询
数据
呢?
、
、
设想一个高度可伸缩的
体系
结构,其中每个租户都是按区域和可用性区域划分和分布的,每个服务器都持有总
数据
的一个子集。还存在冗余,还有承载相同逻辑碎片的物理碎片。这很好,如果客户端知道分配给用户的所有逻辑碎片,那么在处理返回极端数量
数据
的请求时,客户端可以使用map/reduce样式检索所有
数据
。这解决了当用户的
数据
量大于任何单个服务器的存储、内存或计算的容量时的问题。那么我的问题是,如果一个名词微服务的
数据
是跨多个服务器隔离和共享的,并且每个服务器都承载着不同的用户或租户子集,我如
浏览 4
提问于2022-07-23
得票数 0
1
回答
新的Synapse & Power世界中分析服务的替代方案?
、
、
随着Synapse、Power BI的发展和
湖
房
体系
结构的兴起,是否有可行的解决方案来
构建
部门多维
数据
集以避免Analysis?我想滑到冰球要去的地方,而不是现在。Power
数据
集中的新特性能否取代Analysis的某些功能,然后将多维
数据
集作为Power
数据
集托管在Power服务中?
浏览 0
提问于2021-06-17
得票数 0
回答已采纳
1
回答
体系
结构帮助-替代ETL
数据
流和处理
、
、
、
我正在寻找一些关于为一个简单的ETL工作
构建
一个架构的指导。我已经
构建
了一个解决方案,但我正在寻找方法来改进或尝试另一个
体系
结构。这里是我的用例: 为此,我
构建
了一个解决方案,用户可以将csv格式的源
数据
上传到云存储。我使用云函数来监视云存储桶中的更改,并触发Dataflow管
浏览 2
提问于2018-08-03
得票数 0
1
回答
您能在Databricks中挂载多个ADLS2实例吗?
、
、
、
为
数据
湖
/三角洲
湖
体系
结构设置DEV/TEST/PROD环境的最佳实践是什么?对于每个DEV/TEST/PROD,您有一个单独的ADLS2实例吗?还是在一个ADLS2实例中托管这三个实例?您甚至可以在
数据
砖中挂载多个ADLS2实例吗?
浏览 6
提问于2022-06-03
得票数 1
1
回答
和Delta层会让它成为
湖
屋吗?
、
即使经过很多资源,我也不明白什么是
湖
房,所以我想问一问。如果我们有Azure Gen 2存储、ADF和Azure
数据
库,可以将传入的CSV文件转换为Delta表,可以称为"Lakehouse“
体系
结构,还是称为"Delta Lake"?或者是"SQL分析“引擎在Delta
湖
层之上使它成为了"Lakehouse"? 请澄清。
浏览 0
提问于2021-06-18
得票数 1
回答已采纳
2
回答
从头开始建
数据
湖
、
、
我正试图从零开始
构建
一个“
数据
湖
”。我理解
数据
湖
是如何工作的,以及它的用途;它遍布互联网。但是,当问题出现时,如何从头开始建立一个,就没有来源了。我想知道如果: 我知道如何运行Hadoop并将
数据
导入Hadoop。我想在前提
数据
湖上建立一个示例来演示我的经理。任何帮助都是非常感谢的。
浏览 1
提问于2019-02-27
得票数 2
回答已采纳
1
回答
如何在Azure
数据
湖
分析和Azure
数据
库之间进行选择
、
Azure
数据
湖
分析和天蓝色
数据
库都可以用于批量处理。谁能帮我理解一下什么时候该选一种而不是另一种?
浏览 0
提问于2018-05-22
得票数 22
回答已采纳
1
回答
数据
湖
中的可信
数据
层能代替
数据
仓库吗?
、
、
、
、
在现代
数据
体系
结构中,将
数据
湖
划分为多个层次,
数据
以原始形式存储在着陆区,然后在可信/应用层进行汇总整理和存储。我相信我们甚至可以通过
数据
湖
中的可信
数据
来进行报告。如果是这样的话,我想不出一种逻辑来证明
数据
仓库的存在是合理的。还是可信
数据
本身就是Datawarehouse?或者信任的
数据
更像是只是聚合
数据
,而不是做适当的建模,因此我们仍然需要
数据
仓库。
浏览 9
提问于2022-07-25
得票数 0
1
回答
从DynamoDB表创建
数据
池
、
、
、
、
我们希望从这个表中创建一个
数据
湖
,用于历史
数据
、模型培训和分析洞察力。我们想保证30分钟的
数据
湖
数据
“新鲜”w.r.t。原来的桌子。但是,我对什么是一个很好的
体系
结构感到困惑:我对
数据
湖
的理解是,您应该使用一个存储服务(即S3)来存储没有处理的原始
数据
。然后,执行ETL工作,在转换、处理和过滤
数据
(例如,使用Glue)之前,将其用于任何应用程序。 ,但我有疑问:,这是否意味着我们必须每30分钟将Dy
浏览 7
提问于2021-08-13
得票数 1
回答已采纳
1
回答
数据
体系
结构-全天蓝色堆栈与集成的三角洲
湖
、
、
如果可能的话,我想征求您对旧的和建议的
体系
结构(或备选方案)的意见,讨论它们的优点和缺点,并可能发现不可预见的问题/限制。当前架构- Azure Stack多源通过Azure
数据
库存储到Azure
数据
湖
Gen2 Azure
数据
库清理
数据
并将其存储回Azure
数据
湖
Gen2中:原始的、干净的使用Analysis都需要始终打开,表示不需要的费用替代
体
浏览 5
提问于2021-12-10
得票数 0
2
回答
阿帕奇星火+三角洲
湖
概念
、
、
、
、
1)
数据
库提出了三层(青铜、银、金),但哪一层是推荐用于机器学习的,为什么?我想他们建议在黄金层中清理和准备
数据
。2)如果抽象这三层的概念,我们可以把青铜层看作
数据
湖
,银层作为
数据
库,黄金层作为
数据
仓库吗?我是说就功能而言。( 3)达美建筑是一个商业术语,还是Kappa
体系
结构的一种演变,还是一种新的趋势建筑,如Lambda和Kappa
体系
结构?(Delta + Lambda架构)和Kappa
体系
结构有什么不同?4)在许多情况下,De
浏览 2
提问于2019-05-19
得票数 22
回答已采纳
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新的
数据
湖
。
数据
以ORC的形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
1
回答
ADF和Databricks层概念的最佳实践
、
我想使用Azure Databricks和Databricks
构建
一个类似于
数据
仓库的层概念,例如摄取层、传播层和
数据
集市层。然而,现在的挑战是如何为每一步编排从/到Databricks的
数据
负载,特别是处理databricks内存中的
数据
模型,以及切换到每个层的持久存储(例如,Azure SQLDB)。但是,如果我将
数据
库中的所有内容保存到处理的最后一层,就很难从ADF中跟踪管道错误,并且很难重新处理特定的层。 我正在寻找最佳实践如何处理一个层概念与ADF和
数据</e
浏览 4
提问于2021-11-13
得票数 0
回答已采纳
2
回答
如何处理
数据
湖
vs
数据
仓库中的历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能的(甚至是核心功能)。随着时间的推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
1
回答
我们可以在一个
数据
仓库中存储多种类型的
数据
吗?
、
、
、
、
我想问一下,我们可以在Hadoop
数据
仓库中存储各种类型的
数据
吗?像RDBMS,JSON Doc,Cassandra Keyspace,txt,CSV等
数据
?它们是否都存储在HDFS中?
浏览 29
提问于2021-07-16
得票数 1
回答已采纳
1
回答
什么是
数据
仓库,它能应用于复杂的
数据
吗?
、
、
、
我想用必要的文献资料来定义
数据
仓库。在中,
数据
仓库这一术语也适用于复杂的
数据
,即视频、图像等,但在本文中,
数据
仓库这一术语仍未定义。
浏览 0
提问于2018-12-05
得票数 1
回答已采纳
1
回答
在AWS中,具有HDFS或S3的
数据
池之间有什么区别?
、
、
、
我需要在AWS上
构建
一个
数据
湖
,但是我不知道S3和HDFS到底有什么不同。我在网上找到了一些答案,但我仍然不明白真正的区别。 我还需要知道是否有人在AWS中拥有HDFS和S3的
数据
湖
架构。
浏览 2
提问于2019-07-11
得票数 1
回答已采纳
1
回答
如何
构建
代表Azure的
数据
湖
(gen 2)的Docker镜像?
、
、
、
/tests/.my_test_env 如何
构建
Docker镜像来模拟Azure
数据
湖
(第2代)?我使用Python3SDK与
数据
湖
进行交互,文档在这里-- 。
浏览 3
提问于2020-08-27
得票数 2
点击加载更多
相关
资讯
企业级数据湖构建探索
大数据生态体系加速构建
精品PPT | “数据湖”构建汽车集团数据中台
数据要素化与数据要素市场体系构建研究
瓜州:运用大数据思维构建干部考评体系
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券