我在评估雅典娜和红移光谱。两者都服务于相同的目的,频谱需要一个适当的红移集群,而雅典娜是纯粹的无服务器的。雅典娜使用Presto,而Spectrum使用其Redshift的引擎
雅典娜或红移光谱有什么特别的缺点吗?使用Athena或Spectrum有什么限制吗?
发布于 2018-05-09 17:56:17
我在几个不同的用例中使用了这两种方法,并得出结论:
红移频谱的优势:
如果你不需要这些东西,那么你也应该考虑雅典娜。
雅典娜与红移光谱的区别:
的“开箱即用”连接。
此外,对于任何一种解决方案,请确保使用AWS胶元数据,而不是雅典娜,因为限制较少。
发布于 2019-01-29 03:46:08
这个问题已经提出了很长一段时间,但我仍然认为我可以为讨论做出一些贡献。
雅典娜是什么?
SQL是一种交互式查询服务,使用标准
可以轻松地分析亚马逊S3中的数据。雅典娜是无服务器的,因此没有基础设施需要管理,您只需为运行的查询付费。(来自文档)
非常直截了当,对吧?
然后就出现了什么是雅典娜红移频谱,为什么亚马逊人在是一个很好的外部表查询解决方案的时候做了它?
所以,亚马逊网络服务的工作人员想要创建一个扩展到Redshift (这是一个非常流行的管理列式数据存储),并赋予它与外部表(通常是S3)对话的能力。但他们想让Redshift用户的生活变得更轻松,主要是分析人员。许多分析工具不支持Athena,但目前支持Redshift。但是创建Reshift集群和存储数据是一个瓶颈。同样,Redshift不是水平可伸缩的,并且在添加新机器的情况下需要一些停机时间。如果你是Redshift的用户,让你的存储更便宜,基本上会让你的生活变得更容易。
我建议您在以下情况下使用Redshift spectrum:
如果您是现有的
在以下情况下,雅典娜会很有用:
总而言之,红移+红移频谱确实是强大的,有很多承诺。但要走向成熟,还有很长的路要走。
发布于 2018-05-15 23:46:00
如果你使用的是Redshift数据库,那么明智的做法是结合使用Spectrum和redshift来获得所需的性能。
然而,如果你开始探索各种选择,那么我们可以考虑将雅典娜作为一个继续前进的工具。
https://stackoverflow.com/questions/50250114
复制相似问题