首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >雅典娜vs红移光谱

雅典娜vs红移光谱
EN

Stack Overflow用户
提问于 2018-05-09 17:38:13
回答 5查看 15.2K关注 0票数 28

我在评估雅典娜和红移光谱。两者都服务于相同的目的,频谱需要一个适当的红移集群,而雅典娜是纯粹的无服务器的。雅典娜使用Presto,而Spectrum使用其Redshift的引擎

雅典娜或红移光谱有什么特别的缺点吗?使用Athena或Spectrum有什么限制吗?

EN

回答 5

Stack Overflow用户

发布于 2018-05-09 17:56:17

我在几个不同的用例中使用了这两种方法,并得出结论:

红移频谱的优势:

  • 允许创建红移表
  • 能够高效地连接红移表和红移谱表

如果你不需要这些东西,那么你也应该考虑雅典娜。

雅典娜与红移光谱的区别:

  • 计费。这是主要的不同之处,根据您的使用情况,您可能会发现比other
  • Performance.便宜得多的产品我发现雅典娜稍微快了一点。
  • SQL的语法和功能。雅典娜起源于presto,与源于postgres.
  • Connectivity.的Redshift略有不同使用API、JDBC或ODBC连接到雅典娜已经很容易了,但是更多的产品提供了到Redshift

的“开箱即用”连接。

此外,对于任何一种解决方案,请确保使用AWS胶元数据,而不是雅典娜,因为限制较少。

票数 29
EN

Stack Overflow用户

发布于 2019-01-29 03:46:08

这个问题已经提出了很长一段时间,但我仍然认为我可以为讨论做出一些贡献。

雅典娜是什么?

SQL是一种交互式查询服务,使用标准

可以轻松地分析亚马逊S3中的数据。雅典娜是无服务器的,因此没有基础设施需要管理,您只需为运行的查询付费。(来自文档)

非常直截了当,对吧?

然后就出现了什么是雅典娜红移频谱,为什么亚马逊人在是一个很好的外部表查询解决方案的时候做了它?

所以,亚马逊网络服务的工作人员想要创建一个扩展到Redshift (这是一个非常流行的管理列式数据存储),并赋予它与外部表(通常是S3)对话的能力。但他们想让Redshift用户的生活变得更轻松,主要是分析人员。许多分析工具不支持Athena,但目前支持Redshift。但是创建Reshift集群和存储数据是一个瓶颈。同样,Redshift不是水平可伸缩的,并且在添加新机器的情况下需要一些停机时间。如果你是Redshift的用户,让你的存储更便宜,基本上会让你的生活变得更容易。

我建议您在以下情况下使用Redshift spectrum:

如果您是现有的

  • 用户,并且您想在Redshift.
  • You中存储更多的数据,您希望将较冷的数据移动到外部表,但在某些情况下,仍然希望与Redshift表连接。如果您只想将数据导入到Pandas或任何其他工具中进行分析,
  • 会触发您的数据卸载。

在以下情况下,雅典娜会很有用:

  • 您是新用户,没有Redshift集群。要访问Spectrum,需要活动的、正在运行的Redshift实例。因此,如果没有红移,红移频谱就不是一个选择。
  • As频谱仍然是一个开发工具,他们正在添加一些功能,如事务处理,以使其更多efficient.
  • BTW雅典娜附带了一个很好的REST API,所以去吧,你想要的。

总而言之,红移+红移频谱确实是强大的,有很多承诺。但要走向成熟,还有很长的路要走。

票数 15
EN

Stack Overflow用户

发布于 2018-05-15 23:46:00

如果你使用的是Redshift数据库,那么明智的做法是结合使用Spectrum和redshift来获得所需的性能。

然而,如果你开始探索各种选择,那么我们可以考虑将雅典娜作为一个继续前进的工具。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50250114

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档