前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Mysql合理建立索引,索引优化

Mysql合理建立索引,索引优化

作者头像
宣言言言
发布于 2019-12-15 13:52:39
发布于 2019-12-15 13:52:39
4.9K00
代码可运行
举报
文章被收录于专栏:宣言(Siam)博客宣言(Siam)博客
运行总次数:0
代码可运行

写在前面

在我们日常使用数据库的时候,肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。

是的,建立索引能极大地提高查询的效率。那么你知道吗,如果合理建立索引,可以更大地榨出数据库的性能——也就等同于进一步提高查询效率。

写下这篇文章就是为了记录一下对索引的优化,合理建立索引。

什么是索引

MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构

我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:B+Tree索引和Hash索引。

索引就相当于字典前的目录,如果这个目录划分规划更好,那么我们找到想要的数据就会更方便,也就提高了查询的效率。

索引的类型有:

  • normal:表示普通索引
  • unique:表示唯一的,不允许有重复值的索引
  • full textl: 表示全文搜索的索引,用于搜索很长一篇文章的时候,效果最好。

建立索引的场景

索引不是越多越好,因为每次更新、插入数据,就需要对索引文件进行变动,会减低该类型操作的执行效率。

如果建立索引的字段太多,影响就会很大。

所以我们只在合理的字段上建立索引

  • 在经常用来当查询条件(where,on,group by,order by)的字段上建立索引。
  • 在数据的维度比较大的字段上建立索引。
  • 对数据较小的列使用索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 为较长的字符串使用前缀索引。比如数据的长度大部分是150个字节,我们只建立前100个字节的索引。

常见的可以用于建立索引的字段场景:

① 用户id 在订单表中的用户id字段上建立索引,根据用户id筛选订单,则会很快查询出用户的订单。 用户一般是在自己的后台查看订单,所以表中的其他用户数据与他无关,如果没有建立索引,每次查询都是全表扫描,则会很慢。(我们每个人在淘宝平台上占的订单比例都不到0.0001)

② 商品名 同上,如果不建立索引,我们在淘宝输入框搜索键盘,怎么快速查询出键盘商品?

③ 日期 常用的活跃数据,一般都是是最近产生的,很少人没事去翻半年前的订单数据吧?

合适的还有很多很多场景,需要各位小伙伴自己好好思量。

索引不生效的场景

并不是建立了索引就在查询语句中生效。

  • 当语句中带有or的时候,索引会失效
  • 当索引的字段使用like查询,并且使用了前通配比如%Siam,索引失效。后通配会生效Siam%
  • 当索引的字段是字符类型,但是储存的值是数字,比如 user_name:’123456’,在查询语句中要 user_name = ‘123456’而不能 user_name = 123456 否则发生类型转换,索引失效,其他类型的字段 比如日期等 也同理
  • 当使用的条件语句,预计结果数量超过全表数据的一定比例时,会转为全表扫描(mysql一般是30%左右)这就是为什么在建立索引的时候要选择维度(区别度)比较高的列,性别这种字段不适合建立索引。
  • 语句中出现列数据运算才判断的,比如where age – 10 > 0 每一行都要运算之后才知道是否大于0 所以就是全表扫描,如果age > 10 则可使用索引。使用函数转换列数据也一样原理。
  • 组合索引时使用的条件语句。

上面举例的一些场景都是比较容易理解的。组合索引还没涉及,往下继续介绍。

mysql中,多个索引同时使用?

先来看一条语句

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
select * from test where user_name = 'siam_007' and create_time = 1563280050

假设在这个表中,user_name字段和create_time都是建立了索引的。也没有发生数据类型转换等情况。

问题:该语句有几个索引生效?

是2个吗?并不是这样子的。

虽然两个字段的索引都没有问题,如果单独使用也都能生效。

但是:MySQL会从可用的索引中猜测出效率最高的一个索引并使用它

怎么证明?使用explain语句(详解可以在网上其他资料找到)

只要在sql语句最前面加上该语法,则会显示查询类型相关的信息。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Explain select * from mysql_index_test where user_name = 'siam_007' and create_time = 1563280050

我建立了两个索引,都能用,都是本次查询只能使用一个。

基于这个情况,会引申出两个知识点

  • 组合索引
  • 多个单字段索引冲突

组合索引

先来说说组合索引吧,我们在新建索引的时候(可视化软件),是这样子的页面

当我们勾选上2个或者2个以上 就能把它叫为组合索引

可以看到还有调整顺序的功能

在组合索引中,字段顺序也是极为重要的。

假设我们有这样一个索引:new : a,b,c 字段

在查询时使用where a = 1 and b = 2 and c= 3。那么这个语句肯定是生效的。

如果我们使用where b = 2 and c =3没有a条件 而a又是在组合索引中最左侧的,那么索引就不会生效。

还是要扫描全部行

where a,c where a,b where b,a,c 这样子使用都是可以生效的。

组合索引要注意字段顺序,是指在创建索引时候的排序,而不是sql语句中where的顺序,我们使用where b = 2 and a = 1 and c = 3也是 可以生效的

那么组合索引的字段顺序要如何排比较好?

后面会有新的一篇文章会讲这个

多个单字段索引冲突

如果我们在表中,拥有两个索引,比如user_name 用户名, user_phone 用户手机号

现在有这样子的数据量: 100W条数据 user_name=’我是用户名’ 100条数据 user_phone=’110′ 5条数据 user_name=’我是用户名’ and user_phone=’110′

假设有这样子一条语句:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
select * from test where user_name = '我是用户名' and user_phone='110'

有两个字段都有索引可用,mysql会选择一个使用。这是属于mysql的内部处理判断

正常情况下,如果用user_phone索引生效的话,会很快得到结果(先筛选出100条 再筛选)

如果user_name生效,则要先筛选100W条数据,再筛选user_phone

mysql的内部判断可能使得user_name索引生效,此时效率就会很低了,我们可以强制使用某个索引

phone是索引名 是新建的时候填的

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
select * from test index(phone) where user_name = '我是用户名' and user_phone='110'

此种情况出现的概率比较小,毕竟mysql的解释器很复杂,也做了足够多的优化。只有排查慢日志并且分析确定索引冲突的情况才需要强制使用索引。

优化 (总结)

  • 只在经常使用的字段上建立索引,否则会拖慢数据更新和插入的速度。
  • 只在维度高的字段上建立索引,否则会使得数据比例过大,转为全表扫描。
  • 优先对数据量比较小的字段建立索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 规范sql语句的生成,禁止发生列运算类型转换的发生。
  • 长字符串可以使用前缀索引,只对字符串的前面一定字符长度建立索引。
  • 组合索引的顺序合理优化(会有新文章介绍)
  • 当多个单字段索引发生冲突时,强制使用某个索引。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.07.18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
FunDA(1)- Query Result Row:强类型Query结果行
本文讨论了如何使用Slick和Playwright库来自动化Web浏览和操作。作者首先介绍了Slick库,它是一个基于Scala的强大的库,用于处理大数据。然后,作者介绍了Playwright库,这是一个用于浏览器自动化和爬虫的库。作者使用Playwright库来自动化Web浏览和操作,包括导航、表单提交和JavaScript交互。此外,作者还讨论了如何利用Playwright库与Slick库进行集成,以实现更高效的数据处理和分析。
用户1150956
2018/01/05
9550
浅谈Slick(2)- Slick101:第一个动手尝试的项目
   看完Slick官方网站上关于Slick3.1.1技术文档后决定开始动手建一个项目来尝试一下Slick功能的具体使用方法。我把这个过程中的一些了解和想法记录下来和大家一起分享。首先我用Intell
用户1150956
2018/01/05
1.7K1
FunDA(2)- Streaming Data Operation:流式数据操作
   在上一集的讨论里我们介绍并实现了强类型返回结果行。使用强类型主要的目的是当我们把后端数据库SQL批次操作搬到内存里转变成数据流式按行操作时能更方便、准确、高效地选定数据字段。在上集讨论示范里我们
用户1150956
2018/01/05
1.4K0
浅谈Slick(1)- 基本功能描述
   Slick (Scala language-integrated connection kit)是scala的一个FRM(Functional Relational Mapper),即函数式的关
用户1150956
2018/01/05
8480
FunDA(15)- 示范:任务并行运算 - user task parallel execution
用户1150956
2018/01/05
6260
FunDA(13)- 示范:用户自定义操作函数 - user defined tasks
   FunDA是一种函数式的编程工具,它所产生的程序是由许多功能单一的细小函数组合而成,这些函数就是用户自定义操作函数了。我们在前面曾经提过FunDA的运作原理模拟了数据流管道。流元素在管道流动的过
用户1150956
2018/01/05
1.3K0
浅谈Slick(3)- Slick201:从fp角度了解Slick
  我在上期讨论里已经成功的创建了一个简单的Slick项目,然后又尝试使用了一些最基本的功能。Slick是一个FRM(Functional Relational Mapper),是为fp编程提供的sc
用户1150956
2018/01/05
2.9K0
浅谈Slick(4)- Slick301:我的Slick开发项目设置
  前面几篇介绍里尝试了一些Slick的功能和使用方式,看来基本可以满足用scala语言进行数据库操作编程的要求,而且有些代码可以通过函数式编程模式来实现。我想,如果把Slick当作数据库操作编程主要
用户1150956
2018/01/05
2.4K0
FunDA(16)- 示范:整合并行运算 - total parallelism solution
该文对技术社区在流式处理方面进行了探讨。首先介绍了基于Apache Spark和Apache Flink的流式处理框架,然后描述了在技术社区中如何利用这些框架进行流式处理。同时,文章还介绍了一些流式处理的应用场景,包括实时数据分析、实时报表、实时ETL等。此外,文章还探讨了流式处理在技术社区中的应用价值,包括缩短开发周期、提高代码复用性、简化运维等方面。
用户1150956
2018/01/05
7880
FunDA(14)- 示范:并行运算,并行数据库读取 - parallel data loading
   FunDA的并行数据库读取功能是指在多个线程中同时对多个独立的数据源进行读取。这些独立的数据源可以是在不同服务器上的数据库表,又或者把一个数据库表分成几个独立部分形成的独立数据源。当然,并行读取
用户1150956
2018/01/05
7430
geotrellis使用(三十)使用geotrellis读取PostGIS空间数据
前言 最近事情很多,各种你想不到的事情——such as singing and dancing——再加上最近又研究docker上瘾,所以geotrellis看上去似乎没有关注,其实我一直在脑中思考着geotrellis。之前看geotrellis源码看到有关geotrellis.slick的相关部分,仅大概浏览了一番,知道是用于读取PostGIS数据库的,未做深入研究,又恰巧前几日有老外在gitter上问了如何读取PostGIS数据库,我当时回答他可以用传统的JDBC方式或者使用geotrellis.sl
魏守峰
2018/04/28
1.7K0
restapi(4)- rest-mongo : MongoDB数据库前端的httpserver
完成了一套标准的rest风格数据库CRUD操作httpserver后发现有许多不足。主要是为了追求“通用”两个字,想把所有服务接口做的更“范generic”些,结果反而限制了目标数据库的特点,最终产生了一套功能弱小的玩具。比如说吧:标准rest风格getbyId需要所有的数据表都具备id这个字段,有点傻。然后get返回的结果集又没有什么灵活的控制方法如返回数量、字段、排序等。特别对MongoDB这样的在查询操作方面接近关系式数据库的分布式数据库:上篇提到过,它的query能力强大,条件组合灵活,如果不能在网络服务api中体现出来就太可惜了。所以,这篇博文会讨论一套专门针对MongoDB的rest-server。我想达到的目的是:后台数据库是MongoDB,通过httpserver提供对MongoDB的CRUD操作,客户端通过http调用CRUD服务。后台开发对每一个数据库表单使用统一的标准增添一套新的CRUD服务。希望如此能够提高开发效率,减少代码出错机会。
用户1150956
2019/08/13
1.9K0
restapi(2)- generic restful CRUD:通用的restful风格数据库表维护工具
研究关于restapi的初衷是想搞一套通用的平台数据表维护http工具。前面谈过身份验证和使用权限、文件的上传下载,这次来到具体的数据库表维护。我们在这篇示范里设计一套通用的对平台每一个数据表的标准维护方式。http服务端数据表维护CRUD有几个标准的部分组成:Model,Repository,Route。我们先看看这几个类型的基类:
用户1150956
2019/07/25
7550
SDP(8):文本式数据库-MongoDB-Scala基本操作
  MongoDB是一种文本式数据库。与传统的关系式数据库最大不同是MongoDB没有标准的格式要求,即没有schema,合适高效处理当今由互联网+商业产生的多元多态数据。MongoDB也是一种分布式数据库,充分具备大数据处理能力和高可用性。MongoDB提供了scala终端驱动mongo-scala-driver,我们就介绍一下MongoDB数据库和通过scala来进行数据操作编程。    与关系数据库相似,MongoDB结构为Database->Collection->Document。Collec
用户1150956
2018/03/16
1.9K0
SDP(12): MongoDB-Engine - Streaming
   在akka-alpakka工具包里也提供了对MongoDB的stream-connector,能针对MongoDB数据库进行streaming操作。这个MongoDB-connector里包含了MongoSource,MongoFlow,MongoSink。我们只使用MongoSource,其它两个我们直接用mapAsyc来创造。下面是MongoSource的定义: object MongoSource { def apply(query: Observable[Document]): Sour
用户1150956
2018/04/02
1.4K0
SDP(5):ScalikeJDBC- JDBC-Engine:Streaming
  作为一种通用的数据库编程引擎,用Streaming来应对海量数据的处理是必备功能。同样,我们还是通过一种Context传递产生流的要求。因为StreamingContext比较简单,而且还涉及到数据抽取函数extractor的传递,所以我们分开来定义: case class JDBCQueryContext[M]( dbName: Symbol, statement: String,
用户1150956
2018/03/16
1.1K0
restapi(5)- rest-mongo 应用实例:分布式图片管理系统之一,rest 服务
最近有同事提起想把网页上的图片存在MongoDB里,我十分赞同。比起把图片以文件形式存放在硬盘子目录的方式,MongoDB有太多的优势。首先,MongoDB是分布式数据库,图片可以跨服务器存储。在一个集群环境里通过复制集、分片等技术可以提高图片读取速度、实现数据的高可用和安全性。再就是对大量的图片可用规范的记录管理方式来进行处理,甚至在一个大流量环境里还可以用集群节点负载平衡方式来助力图片的存取。
用户1150956
2019/09/29
8560
Akka(35): Http:Server side streaming
该文介绍了如何使用Akka HTTP和Slick在Scala中实现基于HTTP的流式数据传输。通过使用Akka HTTP和Slick,可以方便地处理HTTP请求和响应,以及从数据库中获取数据并将其传输到客户端。该文还介绍了如何使用Akka流式处理技术来实现HTTP服务,并处理响应数据。
用户1150956
2018/01/05
8510
FunDA(6)- Reactive Streams:Play with Iteratees、Enumerator and Enumeratees
    在上一节我们介绍了Iteratee。它的功能是消耗从一些数据源推送过来的数据元素,不同的数据消耗方式代表了不同功能的Iteratee。所谓的数据源就是我们这节要讨论的Enumerator。En
用户1150956
2018/01/05
6860
Scala 强大的精简语法(示例)
本文介绍了 Scala 的强大精简语法,通过示例展示了如何利用 Scala 的特性进行高效的开发。主要包括以下内容:首先介绍了 Scala 的特点和优势,然后通过具体的代码示例演示了如何使用 Scala 进行高效的开发,包括使用隐式转换、集合操作、并发编程等。最后通过一个具体的实例,展示了如何使用 Scala 实现一个淘宝商品信息的提取和入库。
田祥
2017/06/15
1.9K0
Scala 强大的精简语法(示例)
推荐阅读
相关推荐
FunDA(1)- Query Result Row:强类型Query结果行
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验