数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。没有一种单一的数据结构对所有用途都有用,所以我们要学各式各样的数据结构,如:线性表、树、图、哈希等
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
秘诀1:
死磕代码!!!!!!!!!!
秘诀2:
画图画图画图+思考
1.《数据结构》严蔚敏
推荐理由:C语言版本,内容详尽,代码规整,各大院校指定教材
2.《数据结构》殷人昆
推荐理由:C++版本,内容详尽,代码规整
3.《算法导论》ThomasH. Cormen (托马斯•科尔曼)
推荐理由:叙述严谨,内容全面,深入讨论各类算法
4.《大话数据结构》程杰
推荐理由:趣味易读,算法讲解细致 深刻
如何衡量一个算法的好坏呢?
案例:旋转数组https://leetcode.cn/problems/rotate-array/description/ 思路:循环K次将数组所有元素向后移动⼀位
void rotate(int* nums, int numsSize, int k) {
while (k--)
{
int end = nums[numsSize - 1];
for (int i = numsSize - 1; i > 0; i--)
{
nums[i] = nums[i - 1];
}
nums[0] = end;
}
}
代码点击执行可以通过,然而点击提交却无法通过,那该如何衡量其好与坏呢?
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。
在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
复杂度在校招中的考察已经很常见,如下:
定义:在计算机科学中,算法的时间复杂度是⼀个函数式T(N),它定量描述了该算法的运行时间。时间复杂度是衡量程序的时间效率, 那么为什么不去计算程序的运行时间呢 ?
那么算法的时间复杂度是一个函数式T(N)到底是什么呢?这个T(N)函数式计算了程序的执行次数。通过c语言编译链接章节学习,我们知道算法程序被编译后生成二进制指令,程序运行,就是cpu执行这些编译好的指令。那么我们通过程序代码或者理论思想计算出程序的执行次数的函数式T(N),假设每句指令执行时间基本一样(实际中有差别,但是微乎其微),那么执行次数和运行时间就是等比正相关,这样也脱离了具体的编译运行环境。执行次数就可以代表程序时间效率的优劣。比如解决一个问题的算法a程序T(N) = N
,算法b程序T(N) = N^2
,那么算法a的效率⼀定优于算法b。
案例:
// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
}
Func1 执行的基本操作次数:
通过对N取值分析,对结果影响最大的一项是
实际中我们计算时间复杂度时,计算的也不是程序的精确的执行次数,精确执行次数计算起来还是很麻烦的(不同的一句程序代码,编译出的指令条数都是不一样的),计算出精确的执行次数意义也不大,因为我么计算时间复杂度只是想比较算法程序的增长量级,也就是当N不断变大时T(N)的差别,上面我们已经看到了当N不断变大时常数和低阶项对结果的影响很小,所以我们只需要计算程序能代表增长量级的大概执行次数,复杂度的表示通常使用大O的渐进表示法。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号
[!IMPORTANT] 💡 推导大O阶规则
通过以上方法,可以得到 Func1
的时间复杂度为:
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
Func2执行的基本操作次数:
根据推导规则第2条得出
Func2
的时间复杂度为:
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++k)
{
++count;
}
for (int k = 0; k < N; ++
k)
{
++count;
}
printf("%d\n", count);
}
Func3执行的基本操作次数:
因此:Func2
的时间复杂度为:
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++k)
{
++count;
}
printf("%d\n", count);
}
Func4执行的基本操作次数:
根据推导规则第3条得出
Func2
的时间复杂度为:
// 计算strchr的时间复杂度?
const char* strchr(const char
* str, int character)
{
const char* p_begin = s;
while (*p_begin != character)
{
if (*p_begin == '\0')
return NULL;
p_begin++;
}
return p_begin;
}
strchr执行的基本操作次数:
1)若要查找的字符在字符串第一个位置,则:
2)若要查找的字符在字符串最后的一个位置,则:
3)若要查找的字符在字符串中间位置,则:
因此:strchr的时间复杂度分为:
[!NOTE] 💡 总结 通过上面我们会发现,有些算法的时间复杂度存在最好、平均和最坏情况。
大O的渐进表示法在实际中一般情况关注的是算法的上界,也就是最坏运行情况。
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
BubbleSort执行的基本操作次数:
1)若数组有序,则:
2)若数组有序且为降序,则:
3)若要查找的字符在字符串中间位置,则:
因此:BubbleSort的时间复杂度取最差情况为:
void func5(int n)
{
int cnt = 1;
while (cnt < n)
{
cnt *= 2;
}
}
当n=2时,执行次数为1
当n=4时,执行次数为2
当n=16时,执行次数为4
假设执行次数为
,则
因此执行次数:
因此:func5的时间复杂度取最差情况为:
[!CAUTION] 注意课件中和书籍中
、
、
的表示。 当n接近无穷大时,底数的大小对结果影响不大(从换底公式的角度来看,也可以理解底数的大小对结果的影响不大。因为换底之后,原来的底数就变成了一个常数系数。用大O表示法则会被省略掉)。因此,一般情况下不管底数是多少都可以省略不写,即可以表示为
。 不同书籍的表示方式不同,以上写法差别不大,建议使用
。
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if (0 == N)
return 1;
return Fac(N - 1) * N;
}
调用一次Fac函数的时间复杂度为
,而在Fac函数中,存在n次递归调用Fac函数
因此:阶乘递归的时间复杂度为:
空间复杂度也是一个数学表达式,是对一个算法在运行过程中因为算法的需要额外临时开辟的空间。
空间复杂度不是程序占用了多少bytes的空间,因为常规情况每个对象大小差异不会很大,所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、⼀些寄存器信息等)在编译期间已经确定好了(还有函数调用时创建的函数栈帧,但是不包括函数递归创建的函数栈帧,因为递归时创建的函数栈帧是运行时创建的。),因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
函数栈帧在编译期间已经确定好了,只需要关注函数在运行时额外申请的空间。
BubbleSort额外申请的空间有exchange等有限个局部变量,使用了常数个额外空间,因此空间复杂度为
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if (N == 0)
return 1;
return Fac(N - 1) * N;
}
Fac递归调用了N次,额外开辟了N个函数栈帧,每个栈帧使用了常数个空间
因此空间复杂度为:
https://leetcode.cn/problems/rotate-array/description/
时间复杂度
循环K次将数组所有元素向后移动一位(但是力扣上代码不通过)
void rotate(int* nums, int numsSize, int k) {
while (k--)
{
int end = nums[numsSize - 1];
for (int i = numsSize - 1; i > 0; i--)
{
nums[i] = nums[i - 1];
}
nums[0] = end;
}
}
时间复杂度
申请新数组空间,先将后k个数据放到新数组中,再将剩下的数据挪到新数组中,但是空间复杂度为
,用了空间换时间的思想
void rotate(int* nums, int numsSize, int k)
{
int newArr[numsSize];
for (int i = 0; i < numsSize; ++i)
{
newArr[(i + k) % numsSize] = nums[i];
}
for (int i = 0; i < numsSize; ++i)
{
nums[i] = newArr[i];
}
}
空间复杂度
void reverse(int* nums, int begin, int end)
{
while (begin < end) {
int tmp = nums[begin];
nums[begin] = nums[end];
nums[end] = tmp;
begin++;
end--;
}
}
void rotate(int* nums, int numsSize, int k)
{
k = k % numsSize;
reverse(nums, 0, numsSize - k - 1);
reverse(nums, numsSize - k, numsSize - 1);
reverse(nums, 0, numsSize - 1);
}