在单个表上有一个不同的查询。
select distinct d, e, f, a, b, c from t where a = 1 and e = 2;在cols a,b,c中的不同值的个数高(高列基数),而cols d,e,f是低基数列。我的数据是S3格式的ORC格式,我在雅典娜和红移谱中有外部表指向同一个文件。
当上面的查询在雅典娜中运行时,它会在几秒内返回,而在红移谱中则需要几分钟。
但是当我移到选择列表的末尾时,它在红移光谱中也能很好地工作。这种情况只发生在这个特定的列中,我的意思是在结尾移动d或e不会有任何区别,即它们运行的时间更长。col和其他列一样是varchar列,该列的最大长度为30字节。
两个问题
发布于 2019-04-05 07:45:14
更新您的红移驱动程序的最新版本,通常可以使您的红移频谱速度几乎一致雅典娜。
https://docs.aws.amazon.com/redshift/latest/mgmt/configure-jdbc-connection.html#download-jdbc-driver
这可能不是您用例中的原因,但绝对值得一试!
https://stackoverflow.com/questions/55527135
复制相似问题