Heapsort类似于 选择排序我们反复选择最大的项目并将其移动到列表的末尾。主要的区别在于,我们不是扫描整个列表来查找最大的项目,而是将列表转换为最大堆(父节点的值总是大于子节点,反之最小堆)以加快速度。
注意:堆一定是一棵完全二叉树
先上一张堆排序动画演示图片:
图、树、二叉树、二叉堆等基本概念,一时三刻讲不完,安利下本人整理的文章
这里摘取二叉树排序需要的重点部分,再过一遍
要了解堆首先得了解一下二叉树,在计算机科学中,二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)。二叉树常被用于实现二叉查找树和二叉堆。
二叉树又分为完全二叉树(complete binary tree)和满二叉树(full binary tree)
满二叉树:一棵深度为 k,且有 2k - 1 个节点称之为满二叉树
深度为 3 的满二叉树 full binary tree
完全二叉树:深度为 k,有 n 个节点的二叉树,当且仅当其每一个节点都与深度为 k 的满二叉树中序号为 1 至 n 的节点对应时,称之为完全二叉树
深度为 3 的完全二叉树 complete binary tree
堆(二叉堆)可以视为一棵完全的二叉树,完全二叉树的一个“优秀”的性质是,除了最底层之外,每一层都是满的,这使得堆可以利用数组来表示(普通的一般的二叉树通常用链表作为基本容器表示),每一个结点对应数组中的一个元素。
如下图,是一个堆和数组的相互关系
对于给定的某个结点的下标 i,可以很容易的计算出这个结点的父结点、孩子结点的下标:
上面的转换为层序遍历
将数组列表转换为堆(也称为“堆化”它)
二叉堆一般分为两种:最大堆和最小堆。
最大堆
最小堆
堆排序就是把最大堆堆顶的最大数取出,将剩余的堆继续调整为最大堆,再次将堆顶的最大数取出,这个过程持续到剩余数只有一个时结束。在堆中定义以下几种操作:
继续进行下面的讨论前,需要注意的一个问题是:数组都是 Zero-Based,这就意味着我们的堆数据结构模型要发生改变
Zero-Based
相应的,几个计算公式也要作出相应调整:
最大堆调整(MAX‐HEAPIFY)的作用是保持最大堆的性质,是创建最大堆的核心子程序,作用过程如图所示:
Max-Heapify
由于一次调整后,堆仍然违反堆性质,所以需要递归的测试,使得整个堆都满足堆性质
下面来一个讲解的更加清楚的
具体步骤:
用 JavaScript 可以表示如下:
/**
* 从 index 开始检查并保持最大堆性质
* @array
* @index 检查的起始下标
* @heapSize 堆大小
**/
function maxHeapify(array, index, heapSize) {
var iMax = index,
iLeft = 2 * index + 1,
iRight = 2 * (index + 1);
if (iLeft < heapSize && array[index] < array[iLeft]) {
iMax = iLeft;
}
if (iRight < heapSize && array[iMax] < array[iRight]) {
iMax = iRight;
}
if (iMax != index) {
swap(array, iMax, index);
maxHeapify(array, iMax, heapSize); // 递归调整
}
}
function swap(array, i, j) {
var temp = array[i];
array[i] = array[j];
array[j] = temp;
}
最小堆调整
minHeapify (arr, i, length) {
let min = i
if (i >= length) {
return
}
// 当前序号的左节点
const l = i * 2 + 1
// 当前需要的右节点
const r = i * 2 + 2
// 求当前节点与其左右节点三者中的最大值
if (l < length && arr[l] < arr[min]) {
min = l
}
if (r < length && arr[r] < arr[min]) {
min = r
}
// 最终max节点是其本身,则已经满足最大堆性质,停止操作
if (min === i) {
return
}
// 父节点与最大值节点做交换
swap(arr, i, min)
// 递归向下继续执行
this.maxHeapify(arr, min, length)
}
通常来说,递归主要用在分治法中,而这里并不需要分治。而且递归调用需要压栈/清栈,和迭代相比,性能上有略微的劣势。当然,按照20/80法则,这是可以忽略的。但是如果你觉得用递归会让自己心里过不去的话,也可以用迭代,比如下面这样:
Build-Max-Heap流程如下:
用 JavaScript 描述如下:
function buildMaxHeap(array, heapSize) {
var i,iParent = Math.floor((heapSize - 1) / 2);
for (i = iParent; i >= 0; i--) {
maxHeapify(array, i, heapSize);
}
}
堆排序(Heap-Sort)是堆排序的接口算法,
由于堆顶元素必然是堆中最大的元素,所以一次操作之后,堆中存在的最大元素被分离出堆,重复n-1次之后,数组排列完毕。整个流程如下:
Heap-Sort
用 JavaScript 描述如下:
function heapSort(array, heapSize) {
buildMaxHeap(array, heapSize);
for (int i = heapSize - 1; i > 0; i--) {
swap(array, 0, i);
maxHeapify(array, 0, i);
}
}
/**
* @description 堆排序-层序遍历数据
* 1、Heap-Sort先调用Build-Max-Heap将数组改造为最大堆,
* 2、然后将堆顶和堆底元素交换,之后将底部上升,
* 3、最后重新调用Max-Heapify保持最大堆性质。
* @param arr {Array} 待排序数组
* @return {*}
*/
function heapSort(arr) {
if(arr.length>1){
// 建立最大堆,堆顶(数组第一元素)就是最大元素
debugger
buildHeap(arr);
// 然后将堆顶和堆底元素交换,最大元素在数组末尾,
// 剩下的数组元素再重新建立最大堆,堆顶(数组第一元素)和数组倒数第i个元素交换,循环此步骤
for(let i=arr.length-1;i>0;i--){
swap(arr,0,i);
adjustHeap(arr,0,i);
}
}
return arr;
}
/**
* @description 创建最大堆,把最大元素冒泡至堆顶
* @param arr {Array}
*/
function buildHeap(arr) {
// 叶子节点的序号>=Math.floor(n/2),因此小于Math.floor(n/2)序号的都是我们需要调整的节点。
for(let i=Math.floor(arr.length/2);i>=0;i--){
adjustHeap(arr,i,arr.length);
}
}
/**
* 找到堆中最大元素,并调整至堆顶
* @param arr
* @param pos
* @param len
*/
function adjustHeap(arr,pos,len) {
// 子左结点
let child=pos*2+1;
while (child<len){
// 如果子左结点 少于子右结点,直接比较子右结点
if(child+1<len&&arr[child]<arr[child+1]){
child++
}
// 如果子结点大于父节点,父子结点交互位置(子结点冒泡至父节点位置,层层冒泡变最大堆)
if(arr[child]>arr[pos]){
swap(arr,child,pos);
pos=child;
child=pos*2+1;
}else {
break;
}
}
}
/**
* 待排序数组
* @param arr {Array}
* @param a {Number}
* @param b {Number}
*/
function swap(arr,a,b) {
let swap=arr[a];
arr[a]=arr[b];
arr[b]=swap;
}
let testArr=[4,3,21,1,4,100,9,1];
console.log(heapSort(testArr));
最后,把上面的整理为完整的 javascript 代码如下:
转载本站文章《再谈堆排序:堆排序算法流程步骤透解—最大堆构建原理》, 请注明出处:https://www.zhoulujun.cn/html/theory/algorithm/SortingAlgorithms/8072.html
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。