首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >选择不同的性能不一致

选择不同的性能不一致
EN

Stack Overflow用户
提问于 2019-04-05 01:39:27
回答 1查看 254关注 0票数 0

在单个表上有一个不同的查询。

代码语言:javascript
复制
select distinct d, e, f, a, b, c from t where a = 1 and e = 2;

在cols a,b,c中的不同值的个数高(高列基数),而cols d,e,f是低基数列。我的数据是S3格式的ORC格式,我在雅典娜和红移谱中有外部表指向同一个文件。

当上面的查询在雅典娜中运行时,它会在几秒内返回,而在红移谱中则需要几分钟。

但是当我移到选择列表的末尾时,它在红移光谱中也能很好地工作。这种情况只发生在这个特定的列中,我的意思是在结尾移动d或e不会有任何区别,即它们运行的时间更长。col和其他列一样是varchar列,该列的最大长度为30字节。

两个问题

  • (a)对特殊行为的任何洞察力或指点-向列表末尾移动使其运行得更快,而在两者之间移动则使其速度变慢。
  • (b)是否有一种建议的SQL最佳做法来按不同的或按语句分组按列基数递减的顺序列出这些列?如果先放置基数较低的列,还是将它们放在混合排列中,执行时间会有所不同吗?
EN

回答 1

Stack Overflow用户

发布于 2019-04-05 07:45:14

更新您的红移驱动程序的最新版本,通常可以使您的红移频谱速度几乎一致雅典娜。

https://docs.aws.amazon.com/redshift/latest/mgmt/configure-jdbc-connection.html#download-jdbc-driver

这可能不是您用例中的原因,但绝对值得一试!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55527135

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档