前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据结构-hash表

数据结构-hash表

作者头像
杨小杰
发布于 2020-02-18 14:59:30
发布于 2020-02-18 14:59:30
85500
代码可运行
举报
运行总次数:0
代码可运行

什么是哈希表

哈希表(散列表)是根据关键码值(Key value)而直接进行访问的数据结构

也就是说,它通过把关键码值映射到表中一个位置来访问记录, 以加快查找的速度。这个映射函数叫做哈希函数,存放记录的数组叫做哈希表。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
给定表M,存在函数f(key),对任意给定的关键字值key,
代入函数后,
若能得到包含该关键字的记录在表中的下标地址,
则称表M为哈希(Hash)表,
函数f(key)为哈希(Hash) 函数。

根据给定的关键字key,运用hash算法得到下标,但是根据算法得到的数据可能会发生下标重复。需要处理hash碰撞冲突,主要有拉链法和线性探测法

优势

上面一堆废话,那hash为啥要这么搞呢(好处是啥)?

举个例子,假如我们现在要插入3个元素:12,15,22

假定数组默认大小是4(size)

给定一个hash算法【算法很多,这里给出一个简单的】h(key) = key%size

index = h(12) = 12%4 = 0

index = h(15) = 15%4 = 3

index = h(22) = 22%4 = 2

index则为元素插入后在数组中的下标

当要查询元素11是否存在的时候怎么查?

for循环遍历查询,如果数组容量很大的时候,根本行不通 如果套入同样的hash算法,是不是很快能得出一个下标,是不是马上可以精准的定位到元素应该被存在的位置

以下内容转载自哈希表原理详解【样式复制问题,个人博客中有原文地址】

还有哪些类似的取下标的算法

1,除法散列法 最直观的一种,上图使用的就是这种散列法,公式: index = value % 16 学过汇编的都知道,求模数其实是通过一个除法运算得到的,所以叫“除法散列法”。(上个例子中的算法)

2,平方散列法 求index是非常频繁的操作,而乘法的运算要比除法来得省时(对现在的CPU来说,估计我们感觉不出来),所以我们考虑把除法换成乘法和一个位移操作。公式: index = (value * value) >> 28 (右移,除以2^28。记法:左移变大,是乘。右移变小,是除。) 如果数值分配比较均匀的话这种方法能得到不错的结果,但我上面画的那个图的各个元素的值算出来的index都是0——非常失败。也许你还有个问题,value如果很大,value * value不会溢出吗?答案是会的,但我们这个乘法不关心溢出,因为我们根本不是为了获取相乘结果,而是为了获取index。

3,斐波那契(Fibonacci)散列法

平方散列法的缺点是显而易见的,所以我们能不能找出一个理想的乘数,而不是拿value本身当作乘数呢?答案是肯定的。

1,对于16位整数而言,这个乘数是40503 2,对于32位整数而言,这个乘数是2654435769 3,对于64位整数而言,这个乘数是11400714819323198485

这几个“理想乘数”是如何得出来的呢?这跟一个法则有关,叫黄金分割法则,而描述黄金分割法则的最经典表达式无疑就是著名的斐波那契数列,即如此形式的序列:0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233,377, 610, 987, 1597, 2584, 4181, 6765, 10946,…。另外,斐波那契数列的值和太阳系八大行星的轨道半径的比例出奇吻合。

对我们常见的32位整数而言,公式: index = (value * 2654435769) >> 28

注:用斐波那契散列法调整之后会比原来的取模散列法好很多。

适用范围 快速查找,删除的基本数据结构,通常需要总数据量可以放入内存。

基本原理及要点 hash函数选择,针对字符串,整数,排列,具体相应的hash方法。 碰撞处理,一种是open hashing,也称为拉链法;另一种就是closed hashing,也称开地址法,opened addressing。

散列冲突的解决方案

1.建立一个缓冲区,把凡是拼音重复的人放到缓冲区中。当我通过名字查找人时,发现找的不对,就在缓冲区里找。

2.进行再探测。就是在其他地方查找。探测的方法也可以有很多种。

(1)在找到查找位置的index的index-1,index+1位置查找,index-2,index+2查找,依次类推。这种方法称为线性再探测。

(2)在查找位置index周围随机的查找。称为随机在探测。

(3)再哈希。就是当冲突时,采用另外一种映射方式来查找。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-01-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 JAVA知识总结与分享 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
哈希表(散列表)原理详解
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构 。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
233333
2019/05/25
8.8K0
从头到尾解析Hash 表算法
问题描述 百度面试题: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。
后端技术探索
2018/08/09
1K0
Hash算法的讲解[通俗易懂]
散列表,又叫哈希表,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。
全栈程序员站长
2022/09/20
2.3K0
Hash算法的讲解[通俗易懂]
小白入门——哈希算法
哈希(Hash)也称为散列,就是把任意长度的输入,通过散列算法,变换成固定长度的输出,这个输出值就是散列值。
tomas家的小拨浪鼓
2019/06/15
1.2K0
【高阶数据结构】哈希表详解
该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)
YIN_尹
2024/01/23
1.1K0
【高阶数据结构】哈希表详解
数据结构 之 哈希表
哈希表(Hash table) 又称为散列表,是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做哈希表。
AUGENSTERN_
2024/04/23
1.4K0
数据结构 之 哈希表
【数据结构】什么是哈希表(散列表)?
在正式开始深入了解哈希表之前呢, 我想带大家先回忆一下生活中咱们的这个"老朋友"。可能你会感到诧异, 我怎么会和它是"老朋友"呢? 别急, 其实你的生活中常常会出现哈希的身影,只是你没有细心观察罢了,不信你看下面几个场景对你来说是不是非常熟悉呢:
修修修也
2024/10/06
2700
【数据结构】什么是哈希表(散列表)?
【数据结构】哈希表
顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为 $O(N)$ ,平衡树中为树的高度,即 $O(logN)$ ,搜索的效率取决于搜索过程中元素的比较次数。
椰椰椰耶
2024/09/20
1180
【数据结构】哈希表
数据结构 纯千干千干货 总结!
By CaesarChang 好久不见 有问题联系邮箱 root121toor@gmail.com
编程张无忌
2021/01/26
2.1K0
数据结构  纯千干千干货  总结!
入门 | 海量数据处理算法总结【超详解】
作者 | Angel_Kitty ➤1. Bloom Filter 【Bloom Filter】 Bloom Filter(BF)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概率算法。Bloom Filter有可能会出现错误判断,但不会漏掉判断。也就是Bloom Filter判断元素不再集合,那肯定不在。如果判断元素存在集合中, 有一定的概率判断错误。因此,Bloom Filter不适合那些“零错误”的应用场
AI科技大本营
2018/04/26
2K0
入门 | 海量数据处理算法总结【超详解】
解析hash(散列)数据结构
在学习完map、set这两个由红黑树构成的容器后,我们来到了这里hash,首先我们要有一个基础的认知——哈希和map与set的仅在使用时的差别区别:前者内部的元素没有序,而后者有序,其它的都相同,这里我们可以通过STL标准库对应的unordered_map和unordered_set的两个名字就能看出,那hash存在的意义在哪里?底层的数据结构又是如何实现的呢?
比特大冒险
2023/04/16
8140
解析hash(散列)数据结构
数据结构与算法之哈希表
哈希表也叫散列表。 散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。 给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
袁新栋-jeff.yuan
2020/08/26
7610
亿万级数据处理的高效解决方案
全文行文是基于面试题的分析基础之上的,具体实践过程中,还是得具体情况具体分析,且各个场景下需要考虑的细节也远比本文所描述的任何一种解决方法复杂得多。
JavaEdge
2018/05/16
5.6K0
野生前端的数据结构基础练习(5)——散列
散列函数相关的应用非常广,例如webpack打包时在文件名中添加的哈希值,将给定信息转换为固定位数字符串的加密信息等都是散列的实际应用,感兴趣的读者可以自行搜索加密,摘要算法相关关键词进行学习。
大史不说话
2018/12/05
6200
【数据结构与算法】哈希表实现:闭散列 && 开散列
​ 顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在 查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为 O(N),平衡树中为树的高度,即 O(
利刃大大
2025/05/01
590
【数据结构与算法】哈希表实现:闭散列 && 开散列
Hash 表
Hash 表
Java架构师必看
2021/04/30
9420
Hash 表
数据结构 Hash表(哈希表)
参考链接:数据结构(严蔚敏) 文章发布很久了,具体细节已经不清晰了,不再回复各种问题 文章整理自严蔚敏公开课视频 可以参考 https://www.bilibili.com/video/av22258871/ 如果链接失效 可以自行搜索 数据结构严蔚敏视频 @2021/07/12
全栈程序员站长
2022/09/15
1.3K0
算法和数据结构: 十一 哈希表
在前面的系列文章中,依次介绍了基于无序列表的顺序查找,基于有序数组的二分查找,平衡查找树,以及红黑树,下图是他们在平均以及最差情况下的时间复杂度:
yaphetsfang
2020/07/30
1K0
算法和数据结构: 十一 哈希表
数据结构 第七章 查找
列表:由同一类型的数据元素组成的集合。 关键码:数据元素中的某个数据项,可以标识列表中的一个或一组数据元素。 键值:关键码的值。 主关键码:可以唯一地标识一个记录的关键码。 次关键码:不能唯一地标识一个记录的关键码。
Twcat_tree
2022/11/29
4650
数据结构 第七章 查找
JavaScript 对象与 Hash 表
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
李振
2021/11/26
2K0
JavaScript 对象与 Hash 表
相关推荐
哈希表(散列表)原理详解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验