我有两张桌子通过第三张桌子连接在一起。第一个表(图像)包含100多万条记录。第二个表(标记)包含大约100 K的记录。第三个表是一个由image_id & tag_id组成的双主键表,包含大约400万条记录。
我一直在努力寻找一种方法来加速通过标签搜索图像。在阅读了十几个记录之后,听起来我最好的选择是分割我的联接表。不幸的是,我从来没有这样做过,而且我害怕可能会丢弃系统中最大的表。
不管怎么说,由于表是一个双主键,所以它是被索引的,但是它仍然需要相当长的时间来查询。我不确定这是严格意义上的那个表的速度,还是我加入的图像表的速度。不管是哪种方式,我现在都要达到2-3秒的查询时间,我担心我会因为更多的图片、更多的标签和更多的用户而陷入更深的困境。
所有查找都使用INT(11)主键完成。我从不搜索短信,也不看varchar字段。有一个查询是查看status CHAR(1)列的。当然,状态不是一个索引,但它应该是吗?我最初认为ENUM的选项是A,I,X,D,但从那时起,我已经扩展到了6种状态类型。
就硬件而言,我的核心是i-7极限,24‘m的DDR3,MySQL存在于120’m的SSD上(只有3 3gbps)。
我能做些什么来加快速度?是瓶颈磁盘io,查询效率低,内存利用率差吗?
作为后续注意,我一直通过MySQL工作台监视服务器活动,我发现了两件有趣的事情:
查询是:
SELECT COUNT(t.image_id) FROM Image_Tags t
INNER JOIN (Images i) ON (i.image_id = t.image_id)
WHERE t.tag_id = :tid
AND i.status = 'A'我开始认为我需要在状态列上抛出一个索引。
发布于 2013-11-20 05:01:04
问题是双主键。作为一个对偶,它基本上必须查看联接表中的每一条记录。我为tag_id添加了一个键,为image_id添加了一个键,大大提高了速度。谢谢麦查利!
https://stackoverflow.com/questions/20087168
复制相似问题