在学习C语言的时候接触的数组在数据结构中是属于线性表的一种,线性表是由一组具有n个相同类型的数据元素组成的。线性表中的任何一个数据元素有且只有一个直接前驱,以及有且只有一个直接后继,另外首元素是没有前驱的,尾元素是没有后继的。
某个元素的左侧相邻元素被称为“直接前驱”,元素左侧所有的数据元素被称为“前驱元素”。
某个元素的右侧相邻元素被称为“直接后继”,元素右侧所有的数据元素被称为“后继元素”。
满足这种数学关系的一组元素,逻辑关系就是线性结构,并且逻辑关系是一对一的,比如一个教室学生的学号、一个排队的队伍、一摞堆好的盘子.....都属于线性结构,当然线性结构和存储方式是无关的,简单理解:只有逻辑关系是一对一的,就是线性结构。
所以,根据数据的存储方式可以把线性表分为两种:顺序存储的线性表,链式存储的线性表。
顺序表指的是使用一组内存地址连续的内存单元来依次存储线性表中的数据元素,使用这种存储结构的线性表就被称为顺序表。
简单理解:数据存储在一块连续的内存中,在C语言中可以具名的数组,也可以使用匿名的数组(堆内存)。
顺序表的特点:数据元素之间的逻辑关系是相邻的,并且内存地址也是相邻的,所以只要知道存储线性表的第一个数据元素的内存地址,就可以对线性表中的任意一个元素进行随机访问。通常用户使用动态分配的数组来实现顺序表,也就是使用堆内存实现。
随机访问指的是在同等时间内具有访问任意元素的能力,和随机访问相对立的就是顺序访问,顺序访问花费的时间要高于随机访问,比如卷轴(顺序)和书籍(随机)、磁带(顺序)和唱片(随机)。
思考一个问题:既然数组可以作为线性表来使用,请问如何对数组中的元素进行增加和删除以及访问?
回答:如果打算使用数组实现线性表的特性,需要知道三个条件:数组首元素地址、数组元素的容量、数组有效的最后一个元素的下标。
SeqList_t * SeqList_Create(unsigned int size)
{
//1.利用calloc为顺序表的管理结构体申请一块堆内存
SeqList_t *Manager = (SeqList_t *)calloc(1,sizeof(Manager));
if(NULL == Manager)
{
perror("calloc memory for manager is failed");
exit(-1); //程序异常终止
}
//2.利用calloc为所有元素申请堆内存
Manager->Addr = (DataType_t *)calloc(size,sizeof(DataType_t));
if (NULL == Manager->Addr)
{
perror("calloc memory for element is failed");
free(Manager);
exit(-1); //程序异常终止
}
//3.对管理顺序表的结构体进行初始化(元素容量 + 最后元素下标)
Manager->Size = size; //对顺序表中的容量进行初始化
Manager->Last = -1; //由于顺序表为空,则最后元素下标初值为-1
return Manager;
}
bool SeqList_IsFull(SeqList_t *Manager)
{
return (Manager->Last + 1 == Manager->Size) ? true : false;
}
bool SeqList_HeadAdd(SeqList_t *Manager, DataType_t Data)
{
//1.判断顺序表是否已满
if ( SeqList_IsFull(Manager) )
{
printf("SequenceList is Full!\n");
return false;
}
//2.如果顺序表有空闲空间,则需要把顺序表所有元素向后移动1个单位
for (int i = Manager->Last;i >= 0;i--)
{
Manager->Addr[i+1] = Manager->Addr[i];
}
//3把新元素添加到顺序表的头部,并且更新管理结构体中的元素下标+1
Manager->Addr[0] = Data;
Manager->Last++;
return true;
}
bool SeqList_TailAdd(SeqList_t *Manager, DataType_t Data)
{
//1.判断顺序表是否已满
if ( SeqList_IsFull(Manager) )
{
printf("SequenceList is Full!\n");
return false;
}
//2.如果顺序表有空闲空间,则把新元素添加到顺序表尾部
Manager->Addr[++Manager->Last] = Data;
return true;
}
bool SeqList_IsEmpty(SeqList_t *Manager)
{
return (-1 == Manager->Last) ? true : false;
}
bool SeqList_Del(SeqList_t *Manager,DataType_t DestVal)
{
int temp = -1; //记录要删除的元素的下标
//1.判断顺序表是否为空
if ( SeqList_IsEmpty(Manager) )
{
printf("SequenceList is Empty!\n");
return false;
}
//2.此时需要查找目标值是否在顺序表中
for (int i = 0; i <= Manager->Last; ++i)
{
//如果目标值和顺序表中元素的值相同
if (DestVal == Manager->Addr[i])
{
temp = i; //把目标元素的下标备份到变量temp中
break;
}
}
//3.如果顺序表没有目标值的元素则直接终止函数
if (-1 == temp)
{
printf("destval [%d] is not found\n",DestVal);
return false;
}
//4.如果找到了目标元素,则直接把该元素的后继元素向前移动一个单位
for (int i = temp ; i < Manager->Last ; ++i)
{
Manager->Addr[i] = Manager->Addr[i+1];
}
//5.由于删除了一个元素,则需要让顺序表的有效元素下标-1
Manager->Last--;
return true;
}
void SeqList_Print(SeqList_t *Manager)
{
for (int i = 0; i <= Manager->Last; ++i)
{
printf("Element[%d] = %d\n",i,Manager->Addr[i]);
}
}
例题
void SeqList_Insert(SeqList *L,int x)
{
int temp = -1; //记录待插入元素的下标
//遍历顺序表,找到插入位置,比较元素
for (int i = 0; i <= last; ++i)
{
if (x < L[i])
{
temp = i;
break;
}
}
if( -1 == temp)
{
L[last+1] = x;
return;
}
//把待插入位置的后继元素向后移动
for (int i = last; i >= temp; i--)
{
L[i+1] = L[i];
}
L[temp] = x;
}
int SeqList_Remove(*L,int p)
{
//判断顺序表的地址是否有效
if(NULL == L)
{
return 0;
}
int e = 0; //变量e,记录待删除元素的值
//把待删除元素的值备份到变量e中
e = L[p];
//把待删除元素的后继元素向前移动一个单位
for (int i = p; i < length; ++i)
{
L[i] = L[i+1];
}
return 1;
}
大家可以知道对于顺序表的数据增加和删除是比较麻烦,因为都需要移动一片连续的内存。
顺序表的优点是:由于顺序表数据元素的内存地址都是连续的,所以可以实现随机访问,而且不需要多余的信息来描述相关的数据,所以存储密度高。
顺序表的缺点是:顺序表的数据在进行增删的时候,需要移动成片的内存,另外,当数据元素的数量较多的时候,需要申请一块较大的连续的内存,同时当数据元素的数量的改变比较剧烈,顺序表不灵活。
思考一个问题:既然顺序表实现数据的增加和删除比较麻烦,又占用连续内存,请问有没有更好方案?
回答:是有的,可以利用链式存储的线性表实现,链式存储指的是采用离散的内存单元来存储数据元素,用户需要使用某种方式把所有的数据元素连接起来,这样就可以变为链式线性表,简称为链表,链表可以高效的使用碎片化内存。
可以看到,顺序表和链式表的区别:顺序表使用连续的内存,链式表使用离散的内存空间。
思考一个问题:既然链表中的每个数据元素的地址都是不固定的,请问用户如何访问某个元素呢?
回答:由于链表中的每个数据元素的地址是不固定的,所以每个数据元素都应该使用一个指针指向直接后继的内存地址,当然最后一个数据元素没有直接后继,所以最后一个数据元素指向NULL即可,作为用户只需要知道第一个数据元素的内存地址,就可以访问后继元素了。
注意:如果采用链式存储,则线性表中每一个数据元素除了存储自身数据之外,还需要额外存储直接后继的地址,所以链表中的每一个数据元素都是由两部分组成:存储自身数据的部分被称为数据域,存储直接后继地址的部分被称为指针域,数据域和指针域组成的数据元素被称为结点(Node)。
注意:链表的工作原理其实很简单,只要大家搞清楚链表的使用流程就可以很轻松的理解,链表具体的操作步骤如下所示:
根据链表的结点的指针域的数量以及根据链表的首尾是否相连,把链式线性表分为以下几种:单向链表、单向循环链表、双向链表、双向循环链表、内核链表。这几种链表的使用规则差不多,只不过指针域数量不同。
上图就是最简单的单向链表的内部结构,可以看到每一个结点都保存了一个地址,每个地址都是逻辑上相邻的下一个结点的地址,只不过末尾结点的指针指向NULL。
另外注意:可以看到链表中是有一个头指针的,头指针只指向第一个元素的地址,想要访问链表中的某个元素只需要通过头指针即可。
思考一个问题:使用顺序表的时候需要创建一个管理结构体来管理顺序表,请问链表需不需要创建?
回答:可以根据用户的需要来选择,一般把链表分为两种:一种是不带头结点的链表,一种是带头结点的链表,头结点指的是管理结构体,只不过头结点只存储第一个元素的内存地址,头结点并不存储有效数据,头结点的意义只是为了方便管理链表。
不带头结点的链表
附带头结点的链表
可以知道,头指针是必须的,因为通过头指针才可以访问链表的元素,头结点是可选的,只是为了方便管理链表而已。
注意:在链表中,还有两个专业名称,一个是首结点,一个是尾结点,三者之前的区别如下:
头结点:是不存储有效数据的,只存储第一个数据元素的地址,头指针只指向头结点。
首结点:是存储有效数据的,也存储直接后继的内存地址,首结点就是第一个结点,首 结点是唯一一个只指向别的结点,不被别的结点指向的结点。
尾结点:是存储有效数据的,尾结点就是链表的最后一个结点,所以尾结点中存储的地 址一般指向NULL,尾结点是唯一一个只被别的结点指向,不能指向别的结点的结点。
为了方便管理单向链表,所以需要构造头结点的数据类型以及构造有效结点的数据类型,如下:
创建一个空链表,一个头结点,对链表进行初始化
LList_t * LList_Create(void)
{
//1.创建一个头结点并对头结点申请内存
LList_t *Head = (LList_t *)calloc(1,sizeof(LList_t));
if (NULL == Head)
{
perror("Calloc memory for Head is Failed");
exit(-1);
}
//2.对头结点进行初始化,头结点是不存储有效内容的!!!
Head->next = NULL;
//3.把头结点的地址返回即可
return Head;
}
创建新的结点,并对新结点进行初始化(数据域 + 指针域)
LList_t * LList_NewNode(DataType_t data)
{
//1.创建一个新结点并对新结点申请内存
LList_t *New = (LList_t *)calloc(1,sizeof(LList_t));
if (NULL == New)
{
perror("Calloc memory for NewNode is Failed");
return NULL;
}
//2.对新结点的数据域和指针域进行初始化
New->data = data;
New->next = NULL;
return New;
}
根据情况把新结点插入到链表中,此时可以分为尾部插入、头部插入、指定位置插入。
bool LList_HeadInsert(LList_t *Head,DataType_t data)
{
//1.创建新的结点,并对新结点进行初始化
LList_t *New = LList_NewNode(data);
if (NULL == New)
{
printf("can not insert new node\n");
return false;
}
//2.判断链表是否为空,如果为空,则直接插入即可
if (NULL == Head->next)
{
Head->next = New;
return true;
}
//3.如果链表为非空,则把新结点插入到链表的头部
New->next = Head->next;
Head->next = New;
return true;
}
根据情况可以从链表中删除某结点,此时可以分为尾部删除、头部删除、指定元素删除。
bool LList_HeadDelete(LList_t *Head)
{
// 1. 判断链表是否为空
if (NULL == Head->next) {
printf("链表为空,无法删除\n");
return false;
}
// 2. 保存要删除的节点
LList_t *DelNode = Head->next;
// 3. 将头节点的next指向第二个节点
Head->next = DelNode->next;
// 4. 释放被删除节点的内存
free(DelNode);
return true;
}