首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【地铁上的面试题】--基础部分--数据结构与算法--排序和搜索算法

排序和搜索算法是计算机科学中非常重要的算法领域。排序算法用于将一组元素按照特定的顺序排列,而搜索算法用于在给定的数据集中查找特定元素的位置或是否存在。 排序算法的基本概念是根据元素之间的比较和交换来实现排序。不同的排序算法采用不同的策略和技巧来达到排序的目的。常见的排序算法包括冒泡排序、插入排序、选择排序、快速排序、归并排序、堆排序和希尔排序等。这些算法的核心思想包括比较和交换、分治法、递归等。排序算法的作用是使数据按照一定的规则有序排列,便于后续的查找、统计和处理。 搜索算法的基本概念是通过遍历数据集来找到目标元素。搜索算法的核心思想包括顺序搜索、二分搜索、广度优先搜索(BFS)、深度优先搜索(DFS)等。顺序搜索是逐个比较元素直到找到目标或遍历完整个数据集,而二分搜索是基于有序数据集进行折半查找。广度优先搜索和深度优先搜索是针对图和树等非线性结构的搜索算法,用于遍历整个结构以找到目标元素或确定其存在性。 排序算法和搜索算法在实际应用中起到至关重要的作用。排序算法可以用于对大量数据进行排序,提高数据的检索效率和处理速度。搜索算法则可以在各种应用中快速定位和获取所需信息,如在数据库中查找特定记录、在搜索引擎中查找相关结果、在图形图像处理中寻找特定图像等。对于开发者和学习者来说,理解和掌握排序和搜索算法是非常重要的。它们是基础算法,也是面试中常被问到的知识点。通过深入学习和实践排序和搜索算法,可以提高编程能力,优化算法设计,并在实际应用

01
您找到你想要的搜索结果了吗?
是的
没有找到

《python算法教程》Day8 - 构建二分搜索树二分搜索树介绍二分搜索树创建代码

今天是《python算法教程》的第8篇读书笔记,笔记的主要内容是构建二分搜索树。 二分搜索树介绍 若要对一组有序值中执行操作(如查找),二分搜索法是一个优秀的选择,因为其时间复杂度仅为对数级。但很多时候,对序列的操作不仅仅是查找,还涉及到插入新数据。若此时选用数组作为存储数据的结构,插入数据的时间复度是线性级的,显然无法满足快速插入数据的需求。因此,这里引入二分搜索树这一既能利于二分搜索又能以对数级的时间完成搜索的数据结构。 二分搜索树创建代码 二分搜索树是一个对象,其提供插入、搜索节点和判断是否存在某个节

013

合理选择数据结构

写程序很重要的一点是选择合理的数据结构,不合适的数据结构在如今高性能计算机盛行的情况下,小数据量体现不出什么来,但是在超大数据的时候, 你所面临的困境将会无穷的放大。 在python里主要的数据结构,也就是内置数据结构,包括了列表,元组,字典以及集合。这四种数据结构分别具有不同的特性,影响着python的方方面面。 列表和元组类似于C的数组,但是不同的是,列表是动态的数组,具有着增删改查的操作,元组是静态的数组,本身是不可变的(除非里面包含了可变的容器类) 。那python为啥还要实现元组呢?按照python之禅所述,Special cases aren't special enough to break the rules...There should be one-- and preferably only one --obvious way to do it. 这是因为元组可以缓存于python的运行环境,在每次使用元组时我们都无需去访问内核分配内存,元组和列表代表着两种不同的方式,元组是一个不会改变事物的多种属性,而 列表是保存多个相对独立的对象的集合。 列表的搜索,如果在已知次序的情况下,使用二分法效率会变得很好,但是如前言所述,在相对独立的对象的数据集合中,有序是比较少见的情况,这意味着对列表的搜索 在python内部结构就只能是遍历。python的内建排序不是如《python源码剖析》所述是快速排序,而是Tim排序,这个排序是google发明的,可以在最好的情况下实现O(n)的复杂度排序 ,在最坏的情况下也有O(log(n))。对于数据的搜索, def b_search(i, haystack): imin, imax = 0, len(haystack) while True: if imin > imax: return -1 mid = (imin + imax) // 2 if haystack[mid] > i: imax = mid elif haystack[mid] < i: imin = mid + 1 else: return mid python的二分搜索实现很简单,因为你不需要再考虑内存溢出以及安全性,这些python已经帮你做好了。还有和二分搜索相似的,就是二叉搜索树。至于如果你不想自己实现 你可以选择bisect模块帮你解决这个问题。 元组因为其的不可改变性,对于列表为了其可变性牺牲的额外的内存以及使用它们进行的额外的计算,元组就内存消耗和速度就快的多了。并且小元组在申请了内存后也就是 不会返还给系统,还留待未来使用,在接下来需要新元组时就不需要向系统申请内存了。 下面看看字典和集合,字典在很多语言内都有实现,也就是映射,属于key-value的一种,在python里集合也是类似字典的结构,只不过没有了value,只有key了。 字典和集合的查询无需遍历,只需要计算散列函数就可获得其值,但这也意味着这两种数据结构会占用更大的内存,而且O(1)的复杂度也取决于散列函数的计算复杂度。 字典插入时,会计算键的散列值,理想的散列函数对应的键应该是就是整数,不会出现任何形式的冲突。计算出散列值后,很重要的一点要计算掩码,来得知value应该存放的 位置。对于冲突的处理,python使用的是开放定址法,会在一个数组里不断‘嗅探’,获得空的内存空间。当然,在字典的内存不够用时,自然会申请空间,这意味着我们需要重新散列值和 掩码。 所以,每种数据结构都有其不同的特性,所以这也意味着选择一个良好的数据数据会使得你的代码效率快上不少。

02

二分搜索树(Binary Search Tree)

在实现二分搜索树之前,我们先思考一下,为什么要有树这种数据结构呢?我们通过企业的组织机构、文件存储、数据库索引等这些常见的应用会发现,将数据使用树结构存储后,会出奇的高效,树结构本身是一种天然的组织结构。常见的树结构有:二分搜索树、平衡二叉树(常见的平衡二叉树有AVL和红黑树)、堆、并查集、线段树、Trie等。Trie又叫字典树或前缀树。   树和链表一样,都属于动态数据结构,由于二分搜索树是二叉树的一种,我们先来说说什么是二叉树。二叉树具有唯一的根节点,二叉树每个节点最多有两个孩子节点,二叉树的每个节点最多有一个父亲节点,二叉树具有天然递归结构,每个节点的左子数也是一棵二叉树,每个节点的右子树也是一颗二叉树。二叉树如下图:

01
领券