前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Mysql索引——Mysql系列(六)

Mysql索引——Mysql系列(六)

原创
作者头像
翰墨飘香
修改于 2025-02-08 00:10:53
修改于 2025-02-08 00:10:53
2760
举报
文章被收录于专栏:Mysql实战Mysql实战翰墨飘香

https://blog.csdn.net/qq_27559331/article/details/99373734

https://zhuanlan.zhihu.com/p/342580205

https://zhuanlan.zhihu.com/p/515672456?utm_id=0

一、常见索引模型

https://zhuanlan.zhihu.com/p/621605230

https://www.cnblogs.com/muxianbai/p/15127751.html

1、hash

哈希表是一种以键 - 值(key-value)存储数据的结构,我们只要输入待查找的键即 key,就可以找到其对应的值即 Value。哈希的思路很简单,把值放在数组里,用一个哈希函数把 key 换算成一个确定的位置,然后把 value 放在数组的这个位置。

不可避免地,多个 key 值经过哈希函数的换算,会出现同一个值的情况。处理这种情况的一种方法是,拉出一个链表。

你可以设想下,如果你现在要找身份证号在ID_card_X, ID_card_Y这个区间的所有用户,就必须全部扫描一遍了。

所以,哈希表这种结构适用于只有等值查询的场景,比如 Memcached 及其他一些 NoSQL 引擎。

2、有序数组

而有序数组在等值查询和范围查询场景中的性能就都非常优秀。还是上面这个根据身份证号查名字的例子,如果我们使用有序数组来实现的话,示意图如下所示:

所以,有序数组索引只适用于静态存储引擎,比如你要保存的是 2017 年某个城市的所有人口信息,这类不会再修改的数据。

3、跳表

Redis中使用

4、搜索树

(1)二叉搜索树

二叉搜索树的特点是:父节点左子树所有结点的值小于父节点的值,右子树所有结点的值大于父节点的值。这样如果你要查 ID_card_n2 的话,按照图中的搜索顺序就是按照 UserA -> UserC -> UserF -> User2 这个路径得到。这个时间复杂度是 O(log(N))。

当然为了维持 O(log(N)) 的查询复杂度,你就需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是 O(log(N))。树可以有二叉,也可以有多叉。多叉树就是每个节点有多个儿子,儿子之间的大小保证从左到右递增。二叉树是搜索效率最高的,但是实际上大多数的数据库存储却并不使用二叉树。其原因是,索引不止存在内存中,还要写到磁盘上。

你可以想象一下一棵 100 万节点的平衡二叉树,树高 20。一次查询可能需要访问 20 个数据块。在机械硬盘时代,从磁盘随机读一个数据块需要 10 ms 左右的寻址时间。也就是说,对于一个 100 万行的表,如果使用二叉树来存储,单独访问一个行可能需要 20 个 10 ms 的时间,这个查询可真够慢的。

为了让一个查询尽量少地读磁盘,就必须让查询过程访问尽量少的数据块。那么,我们就不应该使用二叉树,而是要使用“N 叉”树。这里,“N 叉”树中的“N”取决于数据块的大小。

(2)红黑树

(3)B树

B树木和B+树的区别

https://blog.csdn.net/ChaoticNg/article/details/114588507

(4)B+树

B+树是对B树的一种变形树,它与B树的差异在于:

  • 有k个子结点的结点必然有k个关键码;
  • 非叶结点仅具有索引作用,跟记录有关的信息均存放在叶结点中。
  • 树的所有叶结点构成一个有序链表,可以按照关键码排序的次序遍历全部记录

为了让一个查询尽量少地读磁盘,就必须让查询过程访问尽量少的数据块。那么,我们就不应该使用二叉树,而是要使用“N 叉”树。这里,“N 叉”树中的“N”取决于数据块的大小。

以 InnoDB 的一个整数字段索引为例,这个 N 差不多是 1200。这棵树高是 4 的时候,就可以存 1200 的 3 次方个值,这已经 17 亿了。考虑到树根的数据块总是在内存中的,一个 10 亿行的表上一个整数字段的索引,查找一个值最多只需要访问 3 次磁盘。其实,树的第二层也有很大概率在内存中,那么访问磁盘的平均次数就更少了。

(5)LSM树

二、InnoDB的索引模型

在InnoDB中,表都是根据主键顺序以索引的形式存放的,这种存储方式的表称为索引组织表。

InnoDB使用了B+树索引模型,每一个索引在InnoDB里面对应一棵B+树。

聚簇索引的叶子结点上存放的是完整的每行数据记录,普通索引的叶子结点上包含该行的主键列,以及为二级索引指定的列

至于为什么使用B+树,请参考

https://www.cnblogs.com/muxianbai/p/15127751.html

InnoDB为什么采用B+树作为索引模型

假设,我们有一个主键列为 ID 的表,表中有字段 k,并且在 k 上有索引。这个表的建表语句是:

create table T(id int primary key, k int not null,name varchar(16),index (k))engine=InnoDB;

从图中不难看出,根据叶子节点的内容,索引类型分为主键索引和非主键索引。

在 InnoDB 里,非主键索引也被称为二级索引(secondary index)。根据上面的索引结构说明,讨

三、索引分类

https://dev.mysql.com/doc/refman/5.7/en/innodb-indexes.html

主键索引/聚簇索引(clustered index)

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式(所有的用户记录都存储在了叶子节点),也就是所谓的索引即数据,数据即索引。

聚簇索引的叶子结点上存放的是完整的每行数据记录

通过聚簇索引访问行很快,因为索引搜索直接指向包含行数据的页面。 如果表很大,与使用索引记录的不同页面存储行数据的存储组织相比,聚集索引架构通常可以节省磁盘 I/O 操作

非主键索引/普通索引/二级索引(secondary index)

聚簇索引以外的索引称为二级索引。 在 InnoDB 中,二级索引中的每条记录都包含该行的主键列,以及为二级索引指定的列。 InnoDB 使用这个主键值来搜索聚集索引中的行。

讨论一个问题:基于主键索引和普通索引的查询有什么区别?

如果语句是 select * from T where ID=500,即主键查询方式,则只需要搜索 ID 这棵 B+ 树;

如果语句是 select * from T where k=5,即普通索引查询方式,则需要先搜索 k 索引树,得到 ID 的值为 500,再到 ID 索引树搜索一次。这个过程称为回表

也就是说,基于非主键索引的查询需要多扫描一棵索引树。因此,我们在应用中应该尽量使用主键查询。

唯一索引(Unique Index)

联合索引 (Multiple-Column Indexes)

前缀索引

全文索引(Full-Text Indexes)

四、索引维护

五、覆盖索引

如果执行的语句是select 主键 from T where key = 3,这时只需要查主键的值,而主键的值已经在key索引树上了,因此可以直接提供查询结果,不需要回表。也就是说,在这个查询里面,索引key已经“覆盖了”我们的查询需求,我们称为覆盖索引。

由于覆盖索引可以减少树的搜索次数,显著提升查询性能,所以使用覆盖索引是一个常用的性能优化手段。

六、回表

七、最左前缀原则

在建立联合索引的时候,如何安排索引内的字段顺序?

因为可以支持最左前缀,所以当已经有了(a,b)这个联合索引后,一般就不需要单独在a上建立索引了。因此,第一原则是,如果通过调整顺序,可以少维护一个索引,那么这个顺序往往就是需要优先考虑采用的。

八、索引下推(Index Condition Pushdown,简称ICP)

一种mysql根据查询的优化方式,即将mysql过滤从服务层到引擎层

Before:根据索引查询记录,然后根据Where来过滤记录

After:Mysql数据库在取出索引的同时,判断是否可以进行Where条件过滤,也就是将Where的部分过滤操作放到了存储引擎层。

https://baijiahao.baidu.com/s?id=1716515482593299829&wfr=spider&for=pc

不符合最左前缀的部分,会怎么样呢?

以市民表的联合索引(name, age)为例。如果现在有一个需求:检索出表中“名字第一个字是张,而且年龄是10岁的所有男孩”。那么,SQL语句是这么写的:

select * from tuser where name like '张%' and age=10 and ismale=1;

在MySQL 5.6之前,只能从name为“张”开头的记录的ID开始一个个回表。到主键索引上找出数据行,再对比字段值。

而MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。InnoDB在(name,age)索引内部就判断了age是否等于10,对于不等于10的记录,直接判断并跳过。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
Apple苹果EDI案例
Apple苹果公司是美国一家高科技公司,截止当地时间2020年8月19日,苹果公司市值已突破2万亿美元。全球化的时代背景下,苹果公司的供应商遍布世界各地。根据Apple苹果公布的200强供应商名录,来自中美日韩的供应商就占据了将近90%的名额。
知行软件EDI
2021/01/15
1.3K0
Apple苹果EDI案例
MACOM EDI 需求分析
企业应该如何与 MACOM 建立 EDI 连接呢?在开始 EDI 项目之前需要先确认 EDI 需求,包括:传输协议以及报文标准等信息。
知行软件EDI
2023/07/31
2080
MACOM EDI 需求分析
与电装DENSO建立EDI连接需要掌握哪些信息?
株式会社电装DENSO CORPORATION是世界汽车零部件及系统的顶级供应商,在2013年《财富》周刊公布的世界500强企业排名中,位列第242名。作为世界顶级汽车技术、系统以及零部件的全球性供应商,电装在环境保护、发动机管理、车身电子产品、驾驶控制与安全、信息和通讯等领域,成为全球主要整车生产商可信赖的合作伙伴。与电装DENSO建立EDI连接需要掌握哪些信息呢?
知行软件EDI
2022/12/13
3330
如何与安森美Onsemi建立EDI连接?
安森美半导体(ON Semiconductor)是应用于高能效电子产品的首要高性能硅方案供应商。其产品包括电源和信号管理、逻辑、分立及定制器件,帮助客户解决他们在汽车、通信、计算机、消费电子等领域的独特设计挑战。近期我们帮助客户成功与安森美Onsemi建立EDI连接,实现自动化地业务数据传输。
知行软件EDI
2022/10/25
5070
如何与安森美Onsemi建立EDI连接?
HD Supply EDI 项目案例
HD Supply EDI 项目需要通过 CommerceHub 平台进行 7 个业务场景的测试,测试流程较为复杂,对于初次接触 EDI 的供应商而言,难免会有些无从下手。 对于 HD Supply EDI 项目,首先供应商需要与 HD Supply 进行需求确认,然后根据已确认的需求进行实施,完成实施后就要和 HD Supply 进行业务测试,根据 HD Supply 要求的业务测试场景对传输的报文格式以及业务数据值进行测试,直至双方的业务系统都确认能够正常处理。
知行软件EDI
2023/08/15
2390
HD Supply EDI 项目案例
如何与沃尔格林Walgreens建立EDI连接?
沃尔格林Walgreens从1901年芝加哥一个家庭作坊式的小店开始,经历了百年沧桑,如今已经拥有4000多家连锁药店,在自己100多年的发展历史中年年赢利,创造了连续100多年的赢利神话。
知行软件EDI
2023/01/03
4040
福特FORD EDI需求分析
福特(Ford)是世界著名的汽车品牌,为美国福特汽车公司(Ford Motor Company)旗下的众多品牌之一。福特在其发展史中始终拥有先进的产业观念,从其“福特制”的生产管理模式可见一斑。
知行软件EDI
2023/02/28
3810
Target Domestic EDI项目实施注意事项及解决方案
Target与供应商传输的是X12标准报文,业务类型包含850(采购订单)、860(订单变更)、864(文本消息)、856(发货通知)和810(发票),供应商通过使用知行EDI直连系统,自动化传输、翻译,实现X12报文自由转换成EXCEL表格,并发送到业务人员邮箱。通过知行EDI平台,供应商可实现与Target供应链系统直连,实时交互业务数据,减少库存与人力成本,精益供应链。 为了实现与供应商EDI直连,Target选用AS2传输协议向供应商发送850、860、864报文,并接收供应商发送的856和810报文。
EDI顾问-杨欢
2020/04/20
6730
迪克体育Dick’s Sporting Goods EDI需求分析
迪克体育用品(Dick’s Sporting Goods,简称迪克体育),是美国一家体育用品零售企业。在美国拥有超过850家连锁店面、年营收额直逼90亿美元的零售巨头,并入选《财富》500强企业榜单。
知行软件EDI
2022/05/27
5280
迪克体育Dick’s Sporting Goods EDI需求分析
如何在EDI系统中区分Target发给不同店铺的订单?
塔吉特Target与供应商传输的是X12标准报文,业务类型包含850(采购订单)、860(订单变更)、864(文本消息)、856(发货通知)和810(发票)。
知行软件EDI
2022/05/09
6390
如何在EDI系统中区分Target发给不同店铺的订单?
零售、跨境外贸中的6大主要EDI报文
EDI全称Electronic Data Interchange,中文名是电子数据交换,也就是我们常听到的“无纸化贸易”。EDI 将企业的业务数据转换为符合国际标准的报文形式,并通过网络完成EDI报文在企业间或者企业内部的电子数据传输。EDI 的出现取代了传统的纸质文件或者电子邮件传输业务信息的方式,提高了数据传输效率。
Shirley_EDI
2023/01/05
1.3K0
零售、跨境外贸中的6大主要EDI报文
宁波旭升&特斯拉 EDI项目案例
宁波旭升汽车技术股份有限公司(以下简称“旭升”),致力于新能源汽车和汽车轻量化领域,主要从事精密铝合金汽车零部件和工业零部件的研发、生产和销售,产品主要应用领域包括新能源汽车变速系统、传动系统、电池系统、悬挂系统等核心系统的精密机械加工零部件。
知行软件EDI
2022/04/15
6930
宁波旭升&特斯拉 EDI项目案例
Babylist EDI 需求详解
Babylist 是一个为准父母提供方便和灵活的婴儿注册服务的平台,帮助他们准备迎接新生儿的到来。Babylist 与各种不同的品牌和零售商合作,包括婴儿用品、玩具、衣物和其他相关产品的制造商。用户可以在 Babylist 上浏览各种不同的产品,并根据自己的需求和喜好选择适合的项目。本文将带大家了解 Babylist 的 EDI 需求,快速理清 EDI 对接思路。
知行软件EDI
2023/07/03
3600
Babylist EDI 需求详解
轮胎行业A公司如何与BRP建立 EDI 连接?
BRP Inc.是一家加拿大的多元化制造商和世界领先的动力体育产品制造商,主要生产雪地摩托、全地形车、旋翼飞行器、公路车辆和船艇等各种动力体育产品,其知名品牌包括 Ski-Doo、Lynx、Sea-Doo、Can-Am和Rotax等。
知行软件EDI
2023/03/22
4350
零售行业R公司对接亚马逊Amazon Device EDI项目案例
为了满足平台货物的多样性,亚马逊Amazon邀请了来自全球各地的优秀供应商加入其供应链体系。要管理如此庞大的供应商群体,需要完成大量的数据处理工作,位列世界500强的Amazon是如何传输这些数据的呢?
知行软件EDI
2022/12/28
4640
如何与 UNI-SELECT 建立 EDI 连接?
UNI-SELECT 是一家专注于汽车零部件分销的领先企业,致力于为全球客户提供优质的汽车维修、保养和美容产品,以满足不断变化的市场需求。多年来,UNI-SELECT 凭借卓越的服务和高品质的产品赢得了众多荣誉和认可,不断推动着整个汽车零部件供应链的发展。
知行软件EDI
2023/08/23
2110
如何与 UNI-SELECT 建立 EDI 连接?
TI EDI 项目数据库方案开源介绍
TI EDI到SQL Server示例流具有预配置的端口,用于从TI的EDI集成规范转换以下交易集:
知行软件EDI
2023/05/26
6100
TI EDI 项目数据库方案开源介绍
Newegg 新蛋供应链管理良策——EDI
美国新蛋网Newegg平台于2001年在美国洛杉矶创立,服务版图遍及全球52国,全球员工 2200人以上,用户总数达3600万、每月访客数达1700万,持续赢得广大网购用户喜爱,被Forbes与Computer Shopper等多家权威媒体评选为最佳购物网站,并在PriceGrabber.com的五星客户满意度评选中获得4.5星的高度荣誉。
知行软件EDI
2023/04/23
3480
Newegg 新蛋供应链管理良策——EDI
福特FORD EDI流程指南
在此前的文章:福特FORD EDI需求分析中,我们为大家介绍了福特FORD的EDI平台——GEC Hub。与福特FORD建立EDI连接需要基于这个平台来进行。
知行软件EDI
2023/03/03
4110
Maxim EDI 案例:EDI 与 ERP API 集成方案
经过双方的前期业务需求确认会议,确认好所要对接的业务类型及实际的业务场景后,美信将给出一个EDI测试计划表。
知行软件EDI
2022/03/28
9920
Maxim EDI 案例:EDI 与 ERP API 集成方案
相关推荐
Apple苹果EDI案例
更多 >
LV.9
这个人很懒,什么都没有留下~
目录
  • 一、常见索引模型
  • 二、InnoDB的索引模型
  • 三、索引分类
    • 主键索引/聚簇索引(clustered index)
    • 非主键索引/普通索引/二级索引(secondary index)
    • 唯一索引(Unique Index)
    • 联合索引 (Multiple-Column Indexes)
    • 前缀索引
    • 全文索引(Full-Text Indexes)
  • 四、索引维护
  • 五、覆盖索引
  • 六、回表
  • 七、最左前缀原则
  • 八、索引下推(Index Condition Pushdown,简称ICP)
加入讨论
的问答专区 >
1高级后端开发工程师擅长3个领域
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档