Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据结构基础详解:哈希表【理论计算篇】开放地址法_线性探测法_拉链法详解

数据结构基础详解:哈希表【理论计算篇】开放地址法_线性探测法_拉链法详解

原创
作者头像
小徐在进步
发布于 2024-10-08 14:35:18
发布于 2024-10-08 14:35:18
4660
举报

哈希表(散列表)

1. 哈希表(散列表)的基本概念

散列表,又称哈希表。是一种数据结构,特点是:数据元素的关键字与其存储地址直接相关。

解释说明 已知关键字,能计算出来它的存储地址

若不同的关键字通过散列函数映射到同一个值,则称他们为“同义词”。

通过散列函数确定的位置已经存放了其他元素,则称这种情况为“冲突”

给出一个具体实例:

注意在本题中,采用处理冲突的方法是拉链法,即两个关键字,映射到相同的地址,就让他们之间顺序的指向

1.查找27的过程:

27%13=1 顺序查找地址1,查到第三个成功查到了27。

2.查找21的过程:

21%13=8,为空。

查找长度为0

查找长度-- 在查找运算中,需要对比关键字的次数称为查找长度

:three: ASL~成功~

(1*6+2*4+3*1+4*1)/12=1.75

平均成功查找长度=查找成功各情况比较的总次数/查找成功的情况总数

最理想的情况

:four: 平均失败查找长度

(0+4+0+2+0+0+2+1+0+0+2+1+0)/13=0.92

平均失败查找长度:从头带尾都查找失败的总次数/散列表长度 其实就是:表中记录数/散列表长度 平均失败查找长度又叫装填因子a ,,,,,,,,,,,,

引出下文:

不难发现,哈希表最重要的两部分是

如何让关键值分布的均匀------散列函数解决

如果冲突了怎么处理 ----------处理冲突的方法

2. 常见的散列函数

2.1 除留余数法

H(key)=key%p

散列表表长为m,取一个不大于m但最接近或等于m单的质数p,这个p作为散列表新的表长

为什么取最大质数?

让不同关键字的冲突尽可能少。所以即使散列表本身是15,为了减少冲突,还是得取13

2.2 直接定址法

直接定址法

H(key)=key或H(key)=a*key+b

适合分布基本连续的情况,如存储同一个班级的学生信息,班内学生学号为(1120112176~1120112205),设计哈希函数为H(key)=key-1120112176

若分布不连续,空位就会比较多,会造成存储空间的浪费。

2.3 数字分析法

选取数码分布较为均匀的若干位作为散列地址

数码在各位上出现的频率不一定相同,可能在某些位上分布的均匀,某些位不均匀

2.4 平方取中法

取关键字的平方值的中间几位作为散列地址

具体取多少位要视实际情况而定。这种方法得到的散列地址与关键的每位都有关系

总结:散列查找是典型的用空间换时间的算法,只要散列函数设计的合理,则散列表越长,冲突的概率越低。

3. 处理冲突的方法

3.1 拉链法

前面提到的拉链法就是处理冲突的一种方法

3.2 开放定址法

  • 线性探测法
  • 平方探测法
  • 伪随机序列法3.2.1开放地址法的定义开放地址法的核心就是说把其他地址开放,发生冲突时,可以把关键字放入其他的地址 数学公式 H~i~=(H(key)+d~i~)%m,其中m是<font color="red">表长!!!</font> d~i~是增量序列,根据d~i~的不同,可以分为三种方法。
  • :star:线性探测法
  • 平方探测法
  • 伪随机序列法 ==注意==:H(key)是哈希函数,哈希函数的计算是哈希函数,开放地址的计算是另一个东西,切不可混淆。尤其是哈希函数➗的是我们人为设置的,而开放地址法➗的是表长。

使用开放地址法计算ASL的时候,要注意空位置的判断也要算作一次比较,和上面的拉链法不同,可以理解为拉链法比较的是空指针,开放地址法是空的元素,所以算作一次

采用开放定址法时,删除结点不能简单地将被删结点的空间置为空,要做一个删除标记,进行逻辑删除(只能逻辑删除),如果不这么做,后面再查找时,可能会出现中间出现截断就不查找了,直接算查找失败了.

3.2.2 开放地址法的三种方法

1.线性探测法:

d~i~=0,1,2,3,4....m-1,即发生冲突时,每次往后探测相邻的下一个单元是否为空。

d~i~,意味着发生第0次冲突,d~i~取0,+d~i~就是+0,意味着发生第1次冲突,d~i~取1,+d~i~就是+1

举一个计算ASL成功的例子

举出一个查找失败的例子:

2.平方探测法:

d~I~=0^2^,1^2^,-1^2^,2^2^,-2^2^,...,k^2^,-k^2^

平方探测法:比起线性探测法更不易产生“聚集”(堆积)问题。

注意一点,一个坑:平方探测法散列表长度m必须是一个可以表示4j+3的素数,才能探测到所有位置。

3.伪随机序列法:d~i~=某个伪随机序列,如d~i~=0,5,24,11,....

3.3 再散列法(再哈希法)

准备多个散列函数,一个发生冲突就用下一个。

4. 重难点题型总结

4.1 拉链法求平均成功查找长度与查找失败长度

ASL~成功~要横着看,(一次查找到的结点数+2*两次的查到的结点数+...n*n次查到的结点数)/表中所有的结点数

ASL~失败~=表中所有的结点数/mod的数

解释说明,上面给出的ASL~失败~只是一种数值相等的公式,并不是理解。

拉链法中空指针算0次比较,所以拉链法在每一种查找失败的情况,就是该条链下结点的个数,mod的数,就是情况数,比如mod7,会得到0-6,7种情况。

例题如下:

【1999年 9分】

4.2 开发地址法之线性探测法求平均成功查找长度与查找失败长度

重点讲解:

1.当用哈希函数算完之后,使用线性探测的时候,要注意,分母变成了表长,不是哈希函数中的modx中的x,并且使用结果是上一步中哈希函数的结果,比如算完46%11=2,假设表长为13,线性探测就是(2+1)%13,而不是(46+1)%13,也不是(2+1)%11,这都是值得注意的。

2.在计算平均查找失败长度的过程中,每一次的情况是遇到空的时候就停止。

分母是映射空间,哈希函数是mod7,地址空间就是0-6,7种情况,从为0的情况出发一直加到6的情况

3.查找成功就是比较次数,这里不多说了

例题1:

例题2:

4.3 开发地址法之平方探测法求平均成功查找长度

根据题目给出的H~i~函数,来具体进行平方探测法的计算,本质和线性探测是一回事

例题1:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
哈希表基本概念介绍及哈希冲突的处理方法(附源码)
  哈希表(散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希(散列)函数,存放记录的数组叫做哈希(散列)表。
嵌入式与Linux那些事
2021/05/20
9310
哈希表基本概念介绍及哈希冲突的处理方法(附源码)
数据结构之哈希表(HASH)
   当我们在编程过程中,往往需要对线性表进行查找操作。在顺序表中查找时,需要从表头开始,依次遍历比较a[i]与key的值是否相等,直到相等才返回索引i;在有序表中查找时,我们经常使用的是二分查找,通过比较key与a[i]的大小来折半查找,直到相等时才返回索引i。最终通过索引找到我们要找的元素。    但是,这两种方法的效率都依赖于查找中比较的次数。我们有一种想法,能不能不经过比较,而是直接通过关键字key一次得到所要的结果呢?这时,就有了散列表查找(哈希表)。
全栈程序员站长
2022/07/21
5920
数据结构之哈希表(HASH)
散列表
http://blog.csdn.net/yyxaf/article/details/7527878 搜索关键词:散列函数、散列表、哈希函数、哈希表、Hash函数、Hash表 散列方法不同于顺序查找、二分查找、二叉排序树及B-树上的查找。它不以关键字的比较为基本操作,采用直接寻址技术。在理想情况下,无须任何比较就可以找到待查关键字,查找的期望时间为O(1)。 散列表的概念 1、散列表 设所有可能出现的关键字集合记为U(简称全集)。实际发生(即实际存储)的关键字集合记为K(|K|比|U|小得多)。 散列方
用户1624346
2018/04/17
1K0
【408&数据结构】散列 (哈希)知识点集合复习&考点题目
散列查找是一种高效的查找方法,它通过散列函数将关键字映射到数组的一个位置,从而实现快速查找。这种方法的时间复杂度平均为(O(1)),但最坏情况下可能会退化到(O(n))。
苏泽
2024/09/09
2830
【408&数据结构】散列 (哈希)知识点集合复习&考点题目
重温数据结构:哈希 哈希函数 哈希表
该文介绍了计算机科学中的哈希表(Hash Table)及其在编程中的应用。哈希表是一种数据结构,可以高效地完成查找、插入、删除等操作。文章还介绍了哈希函数、哈希冲突、拉链法等概念。
张拭心 shixinzhang
2018/01/05
2.7K1
重温数据结构:哈希 哈希函数 哈希表
【数据结构】什么是哈希表(散列表)?
在正式开始深入了解哈希表之前呢, 我想带大家先回忆一下生活中咱们的这个"老朋友"。可能你会感到诧异, 我怎么会和它是"老朋友"呢? 别急, 其实你的生活中常常会出现哈希的身影,只是你没有细心观察罢了,不信你看下面几个场景对你来说是不是非常熟悉呢:
修修修也
2024/10/06
2550
【数据结构】什么是哈希表(散列表)?
《大话数据结构》 查找 以及一个简单的哈希表例子
第八章 查找 定义:查找就是根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录)。 8.2 查找概论 查找表(Search table):是由同一类型的数据元素构成的集合。 关键字(key):是数据元素中某个数据项的值,又称为键值。 若此关键字可以唯一的标识一个记录,则称此关键字为主关键字(Primary key)。 对于那些可以识别多个数据元素的关键字,我们称为次关键字(Secondary key)。 查找表按照操作方式来分有两大种:静态查找表和动态查找表 静态查找表(Static
xcywt
2018/03/28
2.4K0
《大话数据结构》 查找 以及一个简单的哈希表例子
数据结构:查找
衡量标准:查找过程中对关键字的平均比较次数——平均查找长度ASL。设查找到第i个元素的概率为p,比较次数为c,则查找成功的ASL_{succ}=\sum^n_{i=1}p_ic_i
ttony0
2022/12/26
9870
数据结构:查找
【数据结构】哈希表
顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为 $O(N)$ ,平衡树中为树的高度,即 $O(logN)$ ,搜索的效率取决于搜索过程中元素的比较次数。
椰椰椰耶
2024/09/20
1120
【数据结构】哈希表
【经验分享】数据结构——哈希查找冲突处理方法(开放地址法-线性探测、平方探测、双散列探测、再散列,分离链接法)
的哈希表,插入一组关键字 [10, 22, 31, 4, 15, 28],并使用线性探测解决冲突。
命运之光
2024/08/17
2330
[算法] 开放寻址法解决哈希冲突方式
开放寻址法:又称开放定址法,当哈希冲突发生时,从发生冲突的那个单元起,按照一定的次序,从哈希表中寻找一个空闲的单元,然后把发生冲突的元素存入到该单元。这个空闲单元又称为开放单元或者空白单元。开放寻址法需要的表长度要大于等于所需要存放的元素数量,非常适用于装载因子较小(小于0.5)的散列表。
唯一Chat
2020/12/31
4K0
哈希表总结
之前给大家介绍了链表,栈和队列今天我们来说一种新的数据结构散列(哈希)表,散列是应用非常广泛的数据结构,在我们的刷题过程中,散列表的出场率特别高。所以我们快来一起把散列表的内些事给整明白吧,文章框架如下。
宿春磊Charles
2022/03/29
7390
哈希表总结
散列表(哈希表)
版权声明:本文为博主原创文章,转载请注明博客地址: https://blog.csdn.net/zy010101/article/details/83998492
zy010101
2019/05/25
7540
程序员必读:教你摸清哈希表的脾气
在哈希表中,记录的存储位置 = f (关键字),通过查找关键字的存储位置即可,不用进行比较。散列技术是在记录的存储位置和它的关键字之间建立一个明确的对应关系f 函数,使得每个关键字 key 对应一个存储位置 f(key) 且这个位置是唯一的。这里我们将这种对应关系 f 称为散列函数,又称为哈希(Hash)函数。采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为散列表或哈希表(Hash table)。
谭庆波
2018/08/10
3930
程序员必读:教你摸清哈希表的脾气
进阶 | 我实现了javascript 哈希表,并进行性能比较
前端爱好者的聚集地 javascript的对象就是一个哈希表,为了学习真正的数据结构,我们还是有必要自己重新实现一下。 基本概念 哈希表(hash table )是一种根据关键字直接访问内存存储位置的数据结构,通过哈希表,数据元素的存放位置和数据元素的关键字之间建立起某种对应关系,建立这种对应关系的函数称为哈希函数。 哈希表的构造方法 假设要存储的数据元素个数是n,设置一个长度为m(m > n)的连续存储单元,分别以每个数据元素的关键字Ki(0<=i<=n-1)为自变量,通过哈希函数hash(Ki),把
用户1097444
2022/06/29
6930
进阶 | 我实现了javascript 哈希表,并进行性能比较
数据结构 之 哈希表
哈希表(Hash table) 又称为散列表,是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做哈希表。
AUGENSTERN_
2024/04/23
1.3K0
数据结构 之 哈希表
数据结构与算法之哈希表
哈希表也叫散列表。 散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。 给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
袁新栋-jeff.yuan
2020/08/26
7570
什么是散列表(哈希表)?
假设你们班级100个同学每个人的学号是由院系-年级-班级和编号组成,例如学号为01100168表示是1系,10级1班的68号。为了快速查找到68号的成绩信息,可以建立一张表,但是不能用学号作为下标,学号的数值实在太大。因此将学号除以1100100取余,即得到编号作为该表的下标,那么,要查找学号为01100168的成绩的时候,只要直接访问表下标为68的数据即可。这就能够在O(1)时间复杂度内完成成绩查找。
编程珠玑
2019/07/12
6580
海量数据处理
  针对海量数据的处理,可以使用的方法非常多,常见的方法有hash法、Bit-map法、Bloom filter法、数据库优化法、倒排索引法、外排序法、Trie树、堆、双层桶法以及MapReduce法。 1、hash法 hash法也成为散列法,它是一种映射关系,即给定一个元素,关键字是key,按照一个确定的散列函数计算出hash(key),把hash(key)作为关键字key对应的元素的存储地址,再进行数据元素的插入和检索操作。   散列表是具有固定大小的数组,表长应该是质数,散列函数是用于关键字和存储
Mister24
2018/05/14
2.2K0
数据结构 Hash表(哈希表)
参考链接:数据结构(严蔚敏) 文章发布很久了,具体细节已经不清晰了,不再回复各种问题 文章整理自严蔚敏公开课视频 可以参考 https://www.bilibili.com/video/av22258871/ 如果链接失效 可以自行搜索 数据结构严蔚敏视频 @2021/07/12
全栈程序员站长
2022/09/15
1.3K0
相关推荐
哈希表基本概念介绍及哈希冲突的处理方法(附源码)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档