首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【C++】STL之空间配置器

【C++】STL之空间配置器

作者头像
小文要打代码
发布2025-05-17 10:10:04
发布2025-05-17 10:10:04
9900
代码可运行
举报
文章被收录于专栏:C++学习历程C++学习历程
运行总次数:0
代码可运行

什么是空间配置器

空间配置器,顾名思义就是 为各个容器高效的管理空间 ( 空间的申请与回收 ) ,在默默地工作。虽然在常规使用STL 时,可能用不到它,但站在学习研究的角度,学习它的实现原理对我们有很大的帮助。

为什么需要空间配置器

前面在模拟实现 vector 、 list 、 map 、 unordered_map 等容器时,所有需要空间的地方都是通过

new 申请的,虽然代码可以正常运行,但是有以下不足之处:

  • 空间申请与释放需要用户自己管理,容易造成内存泄漏
  • 频繁向系统申请小块内存块,容易造成内存碎片
  • 频繁向系统申请小块内存,影响程序运行效率
  • 直接使用malloc与new进行申请,每块空间前有额外空间浪费
  • 申请空间失败怎么应对
  • 代码结构比较混乱,代码复用率不高
  • 未考虑线程安全问题

SGI-STL空间配置器实现原理

以上提到的几点不足之处,最主要还是: 频繁向系统申请小块内存造成的 。那什么才算是小块内

存? SGI-STL 128 作为小块内存与大块内存的分界线,将空间配置器其分为两级结构,一级空间

配置器处理大块内存,二级空间配置器处理小块内存

一级空间配置器

一级空间配置器原理非常简单,直接对 malloc 与 free 进行了封装,并增加了 C++ 中

set_new_handle 思想。

代码语言:javascript
代码运行次数:0
运行
复制
template <int inst>
class __malloc_alloc_template
{
private:
 static void *oom_malloc(size_t);
public:
// 对malloc的封装
 static void * allocate(size_t n)
 {
   // 申请空间成功,直接返回,失败交由oom_malloc处理
 void *result = malloc(n);
if (0 == result) 
   result = oom_malloc(n);
 return result;
 }
// 对free的封装
 static void deallocate(void *p, size_t /* n */)
 { free(p);}
 // 模拟set_new_handle
 // 该函数的参数为函数指针,返回值类型也为函数指针
 // void (*   set_malloc_handler( void (*f)() ) )()
 static void (* set_malloc_handler(void (*f)()))()
 {
 void (* old)() = __malloc_alloc_oom_handler;
 __malloc_alloc_oom_handler = f;
 return(old);
 }
};
// malloc申请空间失败时代用该函数
template <int inst>
void * __malloc_alloc_template<inst>::oom_malloc(size_t n)
{
void (* my_malloc_handler)();
void *result;
for (;;) 
{
   // 检测用户是否设置空间不足应对措施,如果没有设置,抛异常,模式new的方式
   my_malloc_handler = __malloc_alloc_oom_handler;
   if (0 == my_malloc_handler)
   {
       __THROW_BAD_ALLOC; 
   }
   
   // 如果设置,执行用户提供的空间不足应对措施
   (*my_malloc_handler)();
   
   // 继续申请空间,可能就会申请成功
   result = malloc(n);
   if (result)
       return(result);
}
}
typedef __malloc_alloc_template<0> malloc_alloc;
二级空间配置器

二级空间配置器专门负责处理小于 128 字节的小块内存 。如何才能提升小块内存的申请与释放的

方式呢? SGI-STL 采用了内存池的技术来提高申请空间的速度以及减少额外空间的浪费,采用哈希

桶的方式来提高用户获取空间的速度与高效管理


内存池
SGI-STL中二级空间配置器设计

SGI-STL 中的二级空间配置器使用了内存池技术 ,但没有采用链表的方式对用户已经归还的空间进

行管理 ( 因为用户申请空间时在查找合适的小块内存时效率比较低 ) ,而是 采用了哈希桶的方式进行

管理 。那是否需要 128 桶个空间来管理用户已经归还的内存块呢?答案是不需要, 因为用户申请

的空间基本都是 4 的整数倍,其他大小的空间几乎很少用到。因此: SGI-STL 将用户申请的内存块

向上对齐到了 8 的整数倍 ( 同学们请思考为什么是 8 的整数倍,而不是 4) 。

SGI-STL二级空间配置器之空间申请

准备:

代码语言:javascript
代码运行次数:0
运行
复制
// 去掉代码中繁琐的部分
template <int inst>
class __default_alloc_template
{
private:
    enum {__ALIGN = 8};     // 如果用户所需内存不是8的整数倍,向上对齐到8的整数
倍
    enum {__MAX_BYTES = 128};   // 大小内存块的分界线
    enum {__NFREELISTS = __MAX_BYTES/__ALIGN};  // 采用哈希桶保存小块内存时
所需桶的个数
    
  // 如果用户所需内存块不是8的整数倍,向上对齐到8的整数倍
  static size_t ROUND_UP(size_t bytes)
 {
        return (((bytes) + __ALIGN-1) & ~(__ALIGN - 1));
 }
  
private:
  // 用联合体来维护链表结构----同学们可以思考下此处为什么没有使用结构体
  union obj
 {
        union obj * free_list_link;
        char client_data[1];    /* The client sees this.       */
 };
    
private:
    static obj *  free_list[__NFREELISTS]; 
  
    // 哈希函数,根据用户提供字节数找到对应的桶号
    static  size_t FREELIST_INDEX(size_t bytes)
   {
        return (((bytes) + __ALIGN-1)/__ALIGN - 1);
   }
    
    // start_free与end_free用来标记内存池中大块内存的起始与末尾位置
    static char *start_free;
    static char *end_free;
    
    // 用来记录该空间配置器已经想系统索要了多少的内存块
    static size_t heap_size;
    
    // ...
} ;

申请空间

代码语言:javascript
代码运行次数:0
运行
复制
// 函数功能:向空间配置器索要空间
// 参数n: 用户所需空间字节数
// 返回值:返回空间的首地址
static void * allocate(size_t n)
{
    obj * __VOLATILE * my_free_list;
    obj * __RESTRICT result;
    // 检测用户所需空间释放超过128(即是否为小块内存)
    if (n > (size_t) __MAX_BYTES) 
   {
        // 不是小块内存交由一级空间配置器处理
        return (malloc_alloc::allocate(n));
   }
    
    // 根据用户所需字节找到对应的桶号
    my_free_list = free_list + FREELIST_INDEX(n);
    result = *my_free_list;
    
    // 如果该桶中没有内存块时,向该桶中补充空间
    if (result == 0)
   {
        // 将n向上对齐到8的整数被,保证向桶中补充内存块时,内存块一定是8的整数倍
        void *r = refill(ROUND_UP(n));
        return r;
   }
    
    // 维护桶中剩余内存块的链式关系
    *my_free_list = result -> free_list_link;
    return (result);
};

填充内存块

代码语言:javascript
代码运行次数:0
运行
复制
// 函数功能:向哈希桶中补充空间
// 参数n:小块内存字节数
// 返回值:首个小块内存的首地址
template <int inst>
void* __default_alloc_template<inst>::refill(size_t n)
{
    // 一次性向内存池索要20个n字节的小块内存
    int nobjs = 20;
    char * chunk = chunk_alloc(n, nobjs);
    
    obj ** my_free_list;
    obj *result;
    obj *current_obj, *next_obj;
    int i;
    // 如果只要了一块,直接返回给用户使用
    if (1 == nobjs) 
        return(chunk);
    
    // 找到对应的桶号
    my_free_list = free_list + FREELIST_INDEX(n);
    // 将第一块返回值用户,其他块连接在对应的桶中
    // 注:此处代码逻辑比较简单,但标准库实现稍微有点复杂,同学们可以自己实现
      result = (obj *)chunk;
      *my_free_list = next_obj = (obj *)(chunk + n);
      for (i = 1; ; i++) 
     {
        current_obj = next_obj;
        next_obj = (obj *)((char *)next_obj + n);
        if (nobjs - 1 == i) 
       {
            current_obj -> free_list_link = 0;
            break;
       } 
        else
       {
            current_obj -> free_list_link = next_obj;
       }
}
    
    return(result);
}

向内存池中索要空间

代码语言:javascript
代码运行次数:0
运行
复制
template <int inst>
char* __default_alloc_template<inst>::chunk_alloc(size_t size, int&
nobjs)
{
    // 计算nobjs个size字节内存块的总大小以及内存池中剩余空间总大小
    char * result;
    size_t total_bytes = size * nobjs;
    size_t bytes_left = end_free - start_free;
    // 如果内存池可以提供total_bytes字节,返回
    if (bytes_left >= total_bytes) 
   {
        result = start_free;
        start_free += total_bytes;
        return(result);
   } 
    else if (bytes_left >= size)
   {
        // nobjs块无法提供,但是至少可以提供1块size字节内存块,提供后返回
        nobjs = bytes_left/size;
        total_bytes = size * nobjs;
        result = start_free;
        start_free += total_bytes;
        return(result);
   } 
    else
   {
        // 内存池空间不足,连一块小块村内都不能提供
 // 向系统堆求助,往内存池中补充空间
        // 计算向内存中补充空间大小:本次空间总大小两倍 + 向系统申请总大小/16
        size_t bytes_to_get = 2 * total_bytes + ROUND_UP(heap_size >>
4);
        
        // 如果内存池有剩余空间(该空间一定是8的整数倍),将该空间挂到对应哈希桶中
        if (bytes_left > 0) 
       {
            // 找对用哈希桶,将剩余空间挂在其上
            obj ** my_free_list = free_list +
FREELIST_INDEX(bytes_left);
           ((obj *)start_free) -> free_list_link = *my_free_list;
            *my_ree_list = (obj *)start_free;
       }
        
        // 通过系统堆向内存池补充空间,如果补充成功,递归继续分配
        start_free = (char *)malloc(bytes_to_get);
        if (0 == start_free) 
       {
            // 通过系统堆补充空间失败,在哈希桶中找是否有没有使用的较大的内存块
            int i;
            obj ** my_free_list, *p;
            for (i = size; i <= __MAX_BYTES; i += __ALIGN)
           {
                my_free_list = free_list + FREELIST_INDEX(i);
                p = *my_free_list;
                
                // 如果有,将该内存块补充进内存池,递归继续分配
                if (0 != p)
               {
                    *my_free_list = p -> free_list_link;
                    start_free = (char *)p;
                    end_free = start_free + i;
                    return(chunk_alloc(size, nobjs));
               }
           }
            
            // 山穷水尽,只能向一级空间配置器求助
        // 注意:此处一定要将end_free置空,因为一级空间配置器一旦抛异常就会出
问题
            end_free = 0;
            start_free = (char *)malloc_alloc::allocate(bytes_to_get);
       }
        
        // 通过系统堆向内存池补充空间成功,更新信息并继续分配
        heap_size += bytes_to_get;
        end_free = start_free + bytes_to_get;
        return(chunk_alloc(size, nobjs));
   }
}
SGI-STL二级空间配置器之空间回收
代码语言:javascript
代码运行次数:0
运行
复制
// 函数功能:用户将空间归还给空间配置器
// 参数:p空间首地址   n空间总大小
static void deallocate(void *p, size_t n)
{
obj *q = (obj *)p;
obj ** my_free_list;
// 如果空间不是小块内存,交给一级空间配置器回收
if (n > (size_t) __MAX_BYTES)
 {
     malloc_alloc::deallocate(p, n);
     return;
 }
// 找到对应的哈希桶,将内存挂在哈希桶中
my_free_list = free_list + FREELIST_INDEX(n);
q -> free_list_link = *my_free_list;
*my_free_list = q;
}

空间配置器的默认选择

SGI-STL默认使用一级还是二级空间配置器,通过USE_MALLOC宏进行控制:

代码语言:javascript
代码运行次数:0
运行
复制
#ifdef __USE_MALLOC
typedef malloc_alloc alloc;
typedef malloc_alloc single_client_alloc;
#else
// 二级空间配置器定义
#endif

在SGI_STL中该宏没有定义,因此:默认情况下SGI_STL使用二级空间配置器

空间配置器的再次封装

在 C++ 中,用户所需空间可能是任意类型的,有单个对象空间,有连续空间,每次让用户自己计

算所需空间总大小不是很友好,因此 SGI-STL 将空间配置器重新再封装了一层:

代码语言:javascript
代码运行次数:0
运行
复制
// T: 元素类型
// Alloc: 空间配置器
// 注意:该类只负责申请与归还对象的空间,不否则空间中对象的构造与析构
template<class T, class Alloc>
class simple_alloc
{
public:
// 申请n个T类型对象大小的空间
static T *allocate(size_t n)
 { 
     return 0 == n? 0 : (T*) Alloc::allocate(n * sizeof (T)); 
 }
// 申请一个T类型对象大小的空间
static T *allocate(void)
 { 
     return (T*) Alloc::allocate(sizeof (T));
 }
// 释放n个T类型对象大小的空间
static void deallocate(T *p, size_t n)
 { 
     if (0 != n) 
         Alloc::deallocate(p, n * sizeof (T));
 }
// 释放一个T类型对象大小的空间
static void deallocate(T *p)
 { 
     Alloc::deallocate(p, sizeof (T)); 
 }
};

对象的构造与释放

一切为了效率考虑, SGI-STL 决定将空间申请释放和对象的构造析构两个过程分离开,因为有些对

象的构造不需要调用析构函数,销毁时不需要调用析构函数,将该过程分离开可以提高程序的性

能:

代码语言:javascript
代码运行次数:0
运行
复制
// 归还空间时,先先调用该函数将对象中资源清理掉
template <class T>
inline void destroy(T* pointer)
{
pointer->~T();
}
// 空间申请好后调用该函数:利用placement-new完成对象的构造
template <class T1, class T2>
inline void construct(T1* p, const T2& value) 
{
new (p) T1(value);
}

注意:

1. 在释放对象时,需要根据对象的类型确定是否调用析构函数 ( 类型萃取 )

2. 对象的类型可以通过迭代器获萃取到

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 什么是空间配置器
  • 为什么需要空间配置器
  • SGI-STL空间配置器实现原理
    • 一级空间配置器
    • 二级空间配置器
    • 内存池
    • SGI-STL中二级空间配置器设计
      • SGI-STL二级空间配置器之空间申请
    • SGI-STL二级空间配置器之空间回收
  • 空间配置器的默认选择
  • 空间配置器的再次封装
  • 对象的构造与释放
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档