Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >分库分表后的索引问题

分库分表后的索引问题

作者头像
方丈的寺院
发布于 2020-03-20 01:50:38
发布于 2020-03-20 01:50:38
2.7K00
代码可运行
举报
文章被收录于专栏:方丈的寺院方丈的寺院
运行总次数:0
代码可运行

摘要

最近遇到一个慢sql,在排查过程中发现和分库分表后的索引设置有关系,总结了下问题。

问题

在进行应用健康度盘点时,发现有个慢sql 如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
select brandgoodid from brandgood_0020
where  userid = xxx AND
brandgoodid  in("xxx1","xxx2")

表结构,按照userid进行的分表

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CREATE TABLE`brandgood_0020` (
  `brandgoodid` char(30) NOT NULL COMMENT ,
  `user_id` int(10) unsigned DEFAULT NULL COMMENT '用户id',
  `created` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
  `last_modified` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  `deleted` bit(1) NOT NULL DEFAULT b'0',
  PRIMARY KEY (`brandgoodid`),
  KEY `idx_userid` (`userid`) USING BTREE,
) ENGINE=InnoDB DEFAULT CHARSET=utf8

explain一下发现走的是userid这个索引,一个用户下面有很多商品,也就有了很多brandgoodid,所以有可能会很慢,因为要扫描很多的索引键去过滤brandgoodid值。而写这个SQL的人期望走的主键索引,而不是'userid'的索引。因为用主键索引,就是N次主键扫描(N表示in中的数量)。

分析

直接原因很明显

IN 这个查询误导了mysql的优化器,选错了索引 IN 查询常常会影响mysql server的判断。主要是IN里面的值数量不同,会影响扫描行数的不同,所以常常会出现索引选择不一致。之前也总结过一篇SQL IN 一定走索引吗

解决

因为用户查询的brandgoodlid是限定在某个group维度下的,一个group对应的brandgood是有限的,在这个业务中,通常小于10。所以这个地方使用主键索引,效率更高。解决方法也就是这地方需要 force index强制走PRIMARY index。

扩展

分库分表后的索引

为什么题目叫分库分表后的索引问题的,直接原因和分库分表并没有什么关系啊?因为在排查问题时,犯了一个错误。以为路由到具体的brandgood_0020表后,可以直接根据brandgoodid主键索引来查询了。认为和一些分布式数据库(cassandra)一样,是clustering key+partition key这种索引数据。可以根据clustering key到数据的节点的partition块,然后根据local index 找到对应的数据。

但其实mysql的分库分表不一样,分表键不是索引,只是客户端路由。只负责找到对应的表。到表以后,就是和单表一样查询逻辑。

因为分表键不是索引,但是查询语句是必须要带着分表键,那意味着我们的分库分表以后的表索引大部分要建成联合索引了,分表键+索引键

要不然我们的查询语句 select xx from table where 分表键=xxx AND a =xxx,是走不了联合索引的。只能走单索引。单索引mysql server要面临着索引选择的问题。

当然并不是绝对的,比如上面我举的那个案例。按照这个思路查看了下其他的分表索引。果然表上的大部分索引都是非联合索引,还是直接从单表copy过来的索引。这些索引基本上都是无用的,因为都的是userid索引.

索引选择的问题

mysql为什么会选错索引呢,详细的请看10 | MySQL为什么有时候会选错索引

我们这个案例是因为判断扫描行数的时候出问题了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 方丈的寺院 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
12个MySQL慢查询的原因分析「建议收藏」
很多时候,我们的慢查询,都是因为没有加索引。如果没有加索引的话,会导致全表扫描的。因此,应考虑在 where 的条件列,建立索引,尽量避免全表扫描。
全栈程序员站长
2022/11/04
2.1K0
盘点MySQL慢查询的12个原因
日常开发中,我们经常会遇到数据库慢查询。那么导致数据慢查询都有哪些常见的原因呢?今天田螺哥就跟大家聊聊导致MySQL慢查询的12个常见原因,以及对应的解决方法。
捡田螺的小男孩
2023/02/24
1.5K0
盘点MySQL慢查询的12个原因
分库分表初探
面试官:这边有个数据库-单表1千万数据,未来1年还会增长多500万,性能比较慢,说下你的优化思路
Joseph_青椒
2023/08/02
5730
分库分表初探
ShardingJdbc分库分表实战案例解析(上)
在对诸如订单、交易、支付等实时在线业务系统的研发、维护过程中,随着业务量的快速增长,我们经常会遇到由于关系型数据库(如:MySql)单表数据量增长过大而引发的线上事故;虽然这些事故多数时候是由于不合理的慢SQL而引起的系统雪崩,但有时也会出现由于数据库热点块IO争用而引发的系统性性能下降。总之,单表数据量的无限增长总是会在这样或那样的情况下增加系统的不稳定性因素。
用户5927304
2020/08/13
1.7K0
ShardingJdbc分库分表实战案例解析(上)
后端程序员必备:MySql索引失效的十大杂症
最近生产爆出一条慢sql,原因是用了or和!=,导致索引失效。于是,总结了索引失效的十大杂症,希望对大家有帮助,加油。
macrozheng
2020/01/20
7000
后端程序员必备:MySql索引失效的十大杂症
数据量大了一定要分表,分库分表Sharding-JDBC入门与项目实战
最近项目中不少表的数据量越来越大,并且导致了一些数据库的性能问题。因此想借助一些分库分表的中间件,实现自动化分库分表实现。调研下来,发现Sharding-JDBC目前成熟度最高并且应用最广的Java分库分表的客户端组件。
程序员白楠楠
2020/12/10
1.9K0
What?数据量巨大还不分库分表?JDBC 入门与项目实战
最近项目中不少表的数据量越来越大,并且导致了一些数据库的性能问题。因此想借助一些分库分表的中间件,实现自动化分库分表实现。调研下来,发现Sharding-JDBC目前成熟度最高并且应用最广的Java分库分表的客户端组件。
用户2781897
2020/09/10
4520
mysql分库分表方案(第十四/十五章/十六章/十七章/十八章)海量数据处理-商用短链
分片策略(如果要看各个策略的实际操作,看ShardingSphere专题视频即可)
高大北
2022/09/23
8580
mysql分库分表方案(第十四/十五章/十六章/十七章/十八章)海量数据处理-商用短链
分库分表 带来了哪些问题?
这篇文章跟大家一起聊聊,分库分表后带来的7个问题,以及相关的解决方案,希望对你会有所帮助。
苏三说技术
2025/01/07
1270
分库分表 带来了哪些问题?
MySQL分库分表分区解析
- 概念:分区是在数据库内部层面将一张大表的数据分割成多个更小的部分,每个部分称为一个分区。尽管从逻辑上看仍然是一个完整的表,但在物理层面上,数据被分布在不同的物理区块上,这些区块可以位于同一台服务器的不同硬盘分区,或甚至是不同服务器上。MySQL支持多种分区类型,如范围分区、列表分区、哈希分区等。
用户7353950
2024/05/25
2160
MySQL分库分表分区解析
springboot实战之mysql分库分表
把存于一个库的数据分散到多个库中,把存于一个表的数据分散到多个表中。如果说读写分离是为了分散数据库读写操作压力,分库分表就是为了分散存储压力
lyb-geek
2019/10/28
7K0
Cardinality统计取值不准确导致MYSQL选错索引
Non_unique:如果是唯一索引,则值为 0,如果可以有重复值,则值为 1 Key_name:索引名字 Seq_in_index:索引中的列序号,比如联合索引 idx_a_b_c (a,b,c) ,那么三个字段分别对应 1,2,3 Column_name:字段名 Collation:字段在索引中的排序方式,A 表示升序,NULL 表示未排序 Cardinality:索引中不重复记录数量的预估值,该值等会儿会详细讲解 Sub_part:如果是前缀索引,则会显示索引字符的数量;如果是对整列进行索引,则该字段值为 NULL Null:如果列可能包含空值,则该字段为 YES;如果不包含空值,则该字段值为 ’ ’ Index_type:索引类型,包括 BTREE、FULLTEXT、HASH、RTREE 等
友儿
2022/09/11
8820
MySQL数据库建表、优化、算法、分区分库分表总结
1、因为任何有业务含义的列都有改变的可能性,主键一旦带上了业务含义,那么主键就有可能发生变更。主键一旦发生变更,该数据在磁盘上的存储位置就会发生变更,有可能会引发页分裂,产生空间碎片。
chenchenchen
2019/09/06
5.6K0
一文快速入门分库分表中间件 Sharding-JDBC (必修课)
书接上文 《一文快速入门分库分表(必修课)》,这篇拖了好长的时间,本来计划在一周前就该写完的,结果家庭内部突然人事调整,领导层进行权利交接,随之宣布我正式当爹,紧接着家庭地位滑落至第三名,还给我分配了一个长期维护任务:带娃。看看我们的靓照,标准的小淑女一枚萌萌哒。
程序员小富
2020/10/26
7610
一文快速入门分库分表中间件 Sharding-JDBC (必修课)
分库分表—1.简要概述
读写磁头在磁盘扇区上读取或者写入数据花费的时间,也就是一次完整的磁盘IO花费的时间,包括如下三个方面:
东阳马生架构
2025/02/17
1681
Springboot2.x + ShardingSphere 实现分库分表
之前一篇文章中我们讲了基于Mysql8的读写分离(文后有链接),这次来说说分库分表的实现过程。
JAVA日知录
2019/10/19
1K0
MySQL - 分库分表
主从模式对于写少读多的场景确实非常大的优势,但是总会写操作达到瓶颈的时候,导致性能提不上去。
Vincent-yuan
2021/10/09
6.2K0
MySQL - 分库分表
基于JdbcTemplate实现分库分表路由
我们做服务端开发的都知道,当数据量到一定程度后单库单表会暴露出各种问题,比如单库数据量过大,查询rt过高等一系列问题。有句俗话描述的特别贴切,不要把鸡蛋放到一个篮子里边,一旦这个篮子漏了或者坏了,那么所有的鸡蛋都在劫难逃,对于我们的业务数据也一样,在条件允许的情况下,尽量不要把所有的数据放到一个数据库或者一张表中,如果数据库宕机或者表由于指定DDL操作长时间锁表,会导致上层服务全线崩溃,如果把数据放到多张表或者多个数据库里边,即使数据库崩溃或者锁表也只会影响固定范围内的服务,而不至于服务全部不可用。
叔牙
2020/11/19
1.7K0
基于JdbcTemplate实现分库分表路由
mysql调优哪些事儿
这边有个数据库-单表1千万数据,未来1年还会增长多500万,性能比较慢,说下你的优化思路
Joseph_青椒
2023/08/06
5040
MySQL 分库分表与分区的区别和思考
说过很多次,不要拘泥于某一个技术的一点,技术是相通的。重要的是编程思想,思想是最重要的。当数据量大的时候,需要具有分的思想去细化粒度。当数据量太碎片的时候,需要具有合的思想来粗化粒度。
Bug开发工程师
2020/02/12
1.3K0
MySQL 分库分表与分区的区别和思考
推荐阅读
相关推荐
12个MySQL慢查询的原因分析「建议收藏」
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验