我们在学C语言的时候,学过很多类型。比如int类型,char类型,float类型等。而这些类型都是属于既定类型,也就是自己无法改变和定义的类型。那么自定义类型顾名思义,就是可以自己来定义的类型。接下来我将要介绍的结构体,联合体,枚举,这些都属于自定义类型。
结构是一些值的集合,这些值被称为成员变量。结构的每个成员可以是不同类型的。
(数组:是一组相同类型元素的集合)
struct tag //tag可自定义
{
member_list; //member_list成员列表
}variable_list; //变量列表
举例:在学校中经常会搜集学生信息进行统计归纳,一般会统计的信息有姓名,性别,电话,年龄,家庭住址,学号。如果用结构体的话,将会是这样表示。
struct student
{
char name[20];//姓名
char sex[3];//性别
int tele[11];//电话
char address[30];//家庭住址
int age[5];//年龄
char id[20];//学号
};
在声明结构体的时候,可以不完全声明,但只能用一次。
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[10],*p;
在上述的结构体在声明的时候都省略掉了结构体的标签(即tag)。
这时,如果我们进行这样的操作是否可行呢。
*p=&x;
答案是否定的,因为编译器会将上述两个声明当成完全不同的两个类型,所以这样的操作是非法的。
在一个结构中是可以包含一个类型为该结构本身的成员。
struct NODE
{
int data; //数据域
struct NODE*next;//指针域
};
结构体要实现自引用,只能通过指针的方式来实现。
C语言中有一个可以将数据类型创建一个新的名字的关键字,即typedef,typedef是否也可以对结构体的声明使用呢?答案是肯定的(但是匿名结构体不可使用)。但是在自引用时要遵循下述方法。
typedef struct node
{
int data;
struct node*next;
}node;
struct student
{
int id[10];
int tele[11];
}s1; //声明结构体变量同时定义变量s1
struct student s2; //定义结构体变量s2
初始化:定义变量的同时赋初值 struct Point p3 = {x, y};
struct student //类型声明
{
char name[15];//名字
int age; //年龄
};
struct student s = {"LiHua", 20};//初始化
嵌套初始化:
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
关于结构体的大小是什么样的,我们先来看一段代码:
#include<stdio.h>
struct s1
{
int i;
char c1;
char c2;
};
struct s2
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct s1));
printf("%d", sizeof(struct s2));
return 0;
}
输出结果:
在上面的代码中,我们定义了两个结构体,都是char c1,char c2和int i,唯一的区别就是三者的位置发生了改变,理应来说我们得到的打印结果都是一样的,但是在vs的环境下,我们却得到了8和12这样的两个结果。为什么呢?这就不得不提到C语言结构体的一个重要概念——结构体的内存对齐。
1.平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取待定类型的数据否则会抛出硬件异常。
2.性能原因
数据结构(尤其是栈)应尽可能地在自然边界上对齐原因在于设计结构的时候,我们既要满足对齐,又要节省空间。
从总体上来说,结构体的内存对齐其实是拿空间换时间的做法,其目的是让程序运行更高效。如何做到对齐和节省空间兼具,其方法为让占用空间小的成员尽量集中在一起。
示例:
strut s1
{
char c1;
int i;
char c2;
};
struct s2
{
char c1;
char c2;
int i;
};
s1和s2的类型是一样的,但是s1和s2所占空间的大小有了一些区别。
在C语言中#pragam这个预处理指令可以改变默认参数,我们可以用这条预处理指令将之前的代码修改一下。
#include<stdio.h>
struct s1
{
int i;
char c1;
char c2;
};
struct s2
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct s1));
printf("%d", sizeof(struct s2));
return 0;
}
输出结果:
结论:
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。
先看这样一段代码:
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
在上述的代码中,有print1和print2两个函数,传参方式分别为结构体传参和结构体地址传参。那这两种方式哪一种方式更好,其实是结构体地址传参。
其原因为:
函数传参的时候,参数是需要压栈的,会有时间上和空间上的系统开销,如果传递一个结构体对象的时候,结构体过大参数压栈的系统开销比较大,所以会导致性能下降,所以在传参的时候,要传结构体地址。
结论:
结构体在传参的时候,要传结构体的地址。
位段的声明和结构是类似的,需要注意的是有两点与结构不同
示例:
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
在上面的代码中,A就是一个位段类型。
总结:跟结构相比,位段可以达到同样效果,但是可以很好节省空间,但是有跨平台的问题存在。
举例:
enum color
{
blue,
yellow,
red,
pink
};
上面定义的color就是枚举枚举类型,{}中的内容就是枚举类型的可能取值,也叫枚举常量 。
这些可能取值都是有值的,默认从0开始,依次递增1,在定义的时候也可以赋初值。
举例:
enum color
{
blue=1,
black=3,
yellow=9,
pink=2
};
enum { red=1, green=2, blue=4 }//只能拿枚举常量给枚举变量赋值,才不会出现类型差异 enum color clr=green; clr=5
联合定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(也叫联合体)
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
联合体的成员是共用一块内存空间的,这样一个联合体变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)
举例:
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
若我们将上述代码中的成员大小给打印出来将会得到以下结果: