struct sdshdr{
int len;
int free;
char buf[];
};
len
:buf数组中字符串的实际使用量。free
:buf数组中空闲量。buf
:存储字符的数组。Redis使用C语言编写,而Redis不使用C语言字符串是有原因的,Redis中的SDS字符串与C字符串相比有如下优点。
C语言字符串是不记录字符串长度的,所以每次获取字符串长度时,都要对字符数组进行一次遍历,那么时间复杂度就为O(n)。 而SDS中采用len记录当前字符串的长度,所以统计字符串长度的时间复杂度为O(1),因此效率高于C字符串。
当使用strcat(char *dest, char *src)
拼接两个字符串时,strcat
是默认第一个字符数组的后面是有足够空间的,它会直接把第二个字符数组中的字符挨个复制到第一个字符数组的后面。
那么问题就来了,如果这两个字符数组的内存空间是紧挨着的,那么当执行strcat时,第二个字符数组的就会被覆盖掉。这就是缓冲区溢出。
所以在使用strcat拼接两个字符串前,一定要先判断第一个字符串后面是否有足够的内存空间;如果不够了,那就得手动扩容。那么这一系列判断+扩容操作都是需要程序员自己去完成的,有些麻烦。
而SDS提供的所有修改字符串的API中,都会判断修改之后是否会内存溢出,如果会内存溢出,它会帮你进行内存扩容。 所以对于SDS而言,这一系列操作都由它来帮你完成,无需程序员手动判断。
内存重分配过程会涉及复杂的算法和系统调用,较为耗时。如果像C字符串那样,每次修改字符串都要进行一次内存重分配,那么效率是极底的,所以SDS使用了『空间预分配』和『惰性空间释放』降低了重分配的频率,从而提升效率。
所谓『二进制安全』就是:往SDS里面放什么数据,取出来还是什么数据。SDS不会对存储的这些数据做任何修改、限制、过滤等。
C字符串对存入的字符串是有严格要求的: 1. 必须符合某种编码(如ASKII) 2. 不能含有空格
而SDS对于存储的数据没有任何限制,因此称为『二进制安全』。
C字符串要求字符数组的末尾必须是\0,作为字符串尾的标记。而SDS中的字符数组也遵循了这一规范,所以仍然可以使用C字符串相关函数,因此避免了重复代码。