我有两张简单的桌子:
CREATE TABLE cat_urls (
Id int(11) NOT NULL AUTO_INCREMENT,
SIL_Id int(11) NOT NULL,
SiteId int(11) NOT NULL,
AsCatId int(11) DEFAULT NULL,
Href varchar(2048) NOT NULL,
ReferrerHref varchar(2048) NOT NULL DEFAULT '',
AddedOn datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
GroupId int(11) DEFAULT NULL,
PRIMARY KEY (Id),
INDEX SIL (SIL_Id, AsCatId)
)
CREATE TABLE products (
Id int(11) NOT NULL AUTO_INCREMENT,
CatUrlId int(11) NOT NULL,
Href varchar(2048) NOT NULL,
SiteIdentity varchar(2048) NOT NULL,
Price decimal(12, 2) NOT NULL,
IsAvailable bit(1) NOT NULL,
ClientCode varchar(256) NOT NULL,
PRIMARY KEY (Id),
INDEX CatUrl (CatUrlId)
)
我有一个很简单的问题:
SELECT cu.Href, COUNT(p.CatUrlId) FROM cat_urls cu
JOIN products p ON p.CatUrlId=cu.Id
WHERE sil_id=4601038
GROUP by cu.Id
解释说:
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE cu ref PRIMARY,SIL SIL 4 const 303 Using where; Using temporary; Using filesort
1 SIMPLE p ref CatUrl CatUrl 4 blue_collar_logs.cu.Id 6 Using index
请告诉我有什么方法可以修复“在哪里使用临时文件”并提高这个查询的性能吗?
发布于 2015-01-13 12:21:20
看起来,出于某种原因,MySQL
选择在第一个表上使用索引SIL
,并将其用于查找(WHERE sil_id = 4601038
)和分组(GROUP BY cu.Id
)。
您可以告诉它使用表的PK
SELECT cu.Href, COUNT(p.CatUrlId) FROM cat_urls cu
USE INDEX FOR JOIN (PRIMARY)
JOIN products p ON p.CatUrlId=cu.Id
WHERE sil_id=4601038
GROUP by cu.Id
它将产生这样的执行计划:
id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra
---+-------------+-------+-------+---------------+---------+---------+------------------+------+-------------
1 | SIMPLE | cu | index | PRIMARY | PRIMARY | 4 | NULL | 1 | Using where
1 | SIMPLE | p | ref | CatUrl | CatUrl | 4 | cbs-test-1.cu.Id | 1 | Using index
忽略列rows
;中报告的值,这些值是不正确的,因为我的表是空的。
注意,Extra
列现在只包含Using where
,但也注意到join type
列从ref
(非常好)更改为index
(完整索引扫描,不太好)。
更好的解决方案是在列SIL_Id
上添加索引。我知道,SIL_Id
是索引SIL(SIL_Id, AsCatId)
的前缀,理论上,列SIL_Id
上的另一个索引是完全无用的。但它似乎解决了这个案子的问题。
ALTER TABLE cat_urls
ADD INDEX (SIL_Id)
;
现在在查询中使用它:
SELECT cu.Href, COUNT(p.CatUrlId) FROM cat_urls cu
USE INDEX FOR JOIN (SIL_Id)
JOIN products p ON p.CatUrlId=cu.Id
WHERE sil_id=4601038
GROUP by cu.Id
查询执行计划现在看起来好多了:
id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra
---+-------------+-------+------+---------------+--------+---------+------------------+------+-------------
1 | SIMPLE | cu | ref | SIL_Id | SIL_Id | 4 | const | 1 | Using where
1 | SIMPLE | p | ref | CatUrl | CatUrl | 4 | cbs-test-1.cu.Id | 1 | Using index
缺点是我们有一个额外的索引(理论上)是无用的。它占用存储空间,每次添加、删除或修改其SIL_Id
字段时都会消耗处理器周期。
https://stackoverflow.com/questions/27645719
复制相似问题