我是亚马逊Redshift的新手。尝试找出在redshift中连接两个表的最佳方法。
我有一个包含23亿条记录的表,id列的数据类型为varchar(40),带有排序键和dist键。
与具有相同列id、排序键和dist键的2300万条记录的其他表进行左连接。
查询需要几个小时才能执行。我有什么地方做错了吗?
发布于 2016-08-10 20:26:20
看看你是否有关于STL_ALERT_EVENT_LOG表的警报,你也可以在你的查询上使用'EXPLAIN‘,并检查你的查询是否使用了通常最快的连接(合并连接)。您还应该识别具有数据倾斜或未排序行的表(请参阅Redshift文档)
https://stackoverflow.com/questions/38855313
复制相似问题