腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
关于三角洲
湖
的困惑
据我所知,它为您的
数据
存储增加了ACID事务,并通过增量
引擎
提高了查询性能。如果是这样,为什么我们还需要其他不支持ACID事务的
数据
湖
呢?Delta lakes声称将
数据
湖
和
数据
仓库这两个世界结合在一起,我们知道,由于它目前对操作的支持,它还不能取代传统的
数据
仓库。但它应该取代
数据
湖
吗?为什么需要两份
数据
副本-一份在
数据
湖
中,另一份在德尔塔
湖
中?
浏览 21
提问于2020-07-30
得票数 0
回答已采纳
1
回答
对Azure表中存储的
数据
执行高级查询(DW?先生?)
、
、
我们是一家广告公司,我们在Azure表中存储了大量
数据
。比如每个用户的页面浏览量、页面动作、会话等。我们选择Azure tables而不是SQL Server的原因是
数据
量太大(每秒数以万计)。我们希望更进一步,并对该
数据
执行高级查询。在Azure生态系统中,这是可能的吗?也许是通过在他们的
数据
仓库产品中加载
数据
,或者通过一些Map Reduce查询?此外,如果上述情况是可能的,我们也在考虑在
数据
仓库中以微批的方式摄取
数据
,以确保我们有一个相对较新的副本,而不必加载大量
浏览 1
提问于2016-03-07
得票数 0
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理
引擎
.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和<em
浏览 8
提问于2016-03-14
得票数 16
1
回答
如何处理Azure
数据
湖
Gen2中的遥测json消息?
、
、
、
我已经模拟了一些设备,这些设备正在向IoT集线器存储发送消息,并通过使用Azure Data创建管道将
数据
(以JSON格式编码)复制到Azure Data Gen2。如何将这些json输出文件转换为CSV文件,由
数据
湖
引擎
处理?我不能直接在蔚蓝
数据
湖
处理所有的json遥测吗?
浏览 0
提问于2019-08-06
得票数 0
回答已采纳
1
回答
和Delta层会让它成为
湖
屋吗?
、
即使经过很多资源,我也不明白什么是
湖
房,所以我想问一问。如果我们有Azure Gen 2存储、ADF和Azure
数据
库,可以将传入的CSV文件转换为Delta表,可以称为"Lakehouse“体系结构,还是称为"Delta Lake"?或者是"SQL分析“
引擎
在Delta
湖
层之上使它成为了"Lakehouse"? 请澄清。
浏览 0
提问于2021-06-18
得票数 1
回答已采纳
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新的
数据
湖
。
数据
以ORC的形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
2
回答
如何处理
数据
湖
vs
数据
仓库中的历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能的(甚至是核心功能)。随着时间的推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
1
回答
AZ synapse链接
数据
平均表在AZ
数据
湖
Gen2中消失
、
、
、
我已经使用azure synapse link将我的dataverse表同步到az Data lake。我验证了表确实出现了。一段时间后,当我检查时,那里没有表。不知道为什么。需要帮助。
浏览 3
提问于2021-07-07
得票数 0
2
回答
使用ADF将元
数据
添加到
数据
湖
文件中
、
Azure Data v2有一个Get元
数据
活动,它可以读取存储在ADLS中的文件上的元
数据
。它可以在移动/复制文件时保留文件上的元
数据
。但是,是否有一种方法可以使用ADF在
湖
文件上添加或修改元
数据
?
浏览 6
提问于2020-12-04
得票数 1
回答已采纳
2
回答
从头开始建
数据
湖
、
、
我正试图从零开始
构建
一个“
数据
湖
”。我理解
数据
湖
是如何工作的,以及它的用途;它遍布互联网。但是,当问题出现时,如何从头开始建立一个,就没有来源了。我想知道如果: 我知道如何运行Hadoop并将
数据
导入Hadoop。我想在前提
数据
湖上建立一个示例来演示我的经理。任何帮助都是非常感谢的。
浏览 1
提问于2019-02-27
得票数 2
回答已采纳
2
回答
数据
仓库能包括一个
数据
湖
吗?
、
、
我想更详细地了解
数据
仓库和
数据
湖
。 可伸缩的存储存储库,保存大量原生格式的原始
数据
(“原样”),直到需要时再加上可以在不损害
数
浏览 0
提问于2018-12-11
得票数 1
1
回答
基于现有标点符号的标记句(TF-下手向量器)
、
、
在dataframe中,我的行包括“机器学习、
数据
、ia、分段、分析”或“大
数据
、
数据
湖
、
数据
可视化、市场营销、搜索
引擎
优化”等句子。因此,术语应该是“分析”、“大
数据
”、“
数据
湖
”、“英语”等等。你知道如何实现这一点吗?
浏览 10
提问于2022-06-15
得票数 0
回答已采纳
2
回答
从
湖
中读取
数据
、
、
、
、
我需要从azure
数据
湖
中读取azure
数据
,并在sql中应用一些连接,并在Web UI中显示。
数据
大约是300 gb,从azure
数据
工厂到azure sql
数据
库的迁移正在以4 4Mbps的速度进行。我也试过使用sql server 2019,它支持polybase,但复制
数据
也需要12-13个小时。我也尝试过cosmos db来存储
湖
中的
数据
,但似乎需要很长时间。任何其他我们可以从湖里读取
数据
的方法。一种方法可
浏览 27
提问于2019-10-17
得票数 0
1
回答
在AWS中,具有HDFS或S3的
数据
池之间有什么区别?
、
、
、
我需要在AWS上
构建
一个
数据
湖
,但是我不知道S3和HDFS到底有什么不同。我在网上找到了一些答案,但我仍然不明白真正的区别。 我还需要知道是否有人在AWS中拥有HDFS和S3的
数据
湖
架构。
浏览 2
提问于2019-07-11
得票数 1
回答已采纳
1
回答
如何
构建
代表Azure的
数据
湖
(gen 2)的Docker镜像?
、
、
、
/tests/.my_test_env 如何
构建
Docker镜像来模拟Azure
数据
湖
(第2代)?我使用Python3SDK与
数据
湖
进行交互,文档在这里-- 。
浏览 3
提问于2020-08-27
得票数 2
1
回答
注册源选项中缺少的Azure权限源(SAP、HIVE、S3、“多源”)
、
希望在订阅/帐户中注册所有
数据
源,但是缺少"Azure (多个源)“选项。其他来源(HIVE、SAP、AWS S3)也是如此。
浏览 2
提问于2021-01-19
得票数 1
回答已采纳
1
回答
Superset可以可视化从REST API调用返回的
数据
吗?
、
、
我们正在尝试使用Apache Superset来可视化业务
数据
,其中一些存储在基于SQL的
数据
库中,但其中一些(例如外部天气
数据
)我们需要通过公共API(通常是REST,但有时也是基于推送的微服务,如websocketsSuperset是否可以以这种方式显示
数据
,或者它是否绑定到SQL或类似SQL的查询/API?
浏览 8
提问于2020-03-24
得票数 2
2
回答
天蓝色水滴存储与天蓝色
数据
湖
存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝
数据
湖
存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝
数据
湖
存储更适合,反之亦然? 谢谢。
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
1
回答
U模式发现
、
数据
湖
方法(根据幻灯片5 )是: 做分析-使用像Hadoop这样的
引擎
。但是,假设我们已经将许多
数据
集加载到我们的
数据
池中,那么如何以自动化和可伸缩的方式进行模式发现呢?using是否支持动态模式发现,或者使用ADLA或其他工具集来实现它的好方法?
浏览 1
提问于2017-07-10
得票数 2
回答已采纳
1
回答
与CTAS相比,创建外部表的利弊是什么?
、
、
、
、
我正在尝试
构建
一个Azure Data管道,它从Azure
数据
湖
中获取
数据
并对其进行转换。 在我看来,这其中的权衡并不明显。
浏览 0
提问于2019-04-17
得票数 1
回答已采纳
点击加载更多
相关
资讯
企业级数据湖构建探索
精品PPT | “数据湖”构建汽车集团数据中台
火山引擎发布湖仓一体分析服务、E-MapReduce,帮助企业构建湖仓架构的大数据平台
云端数智新引擎,腾讯云原生数据湖计算重磅发布
数据湖与大数据?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券