【C++】map 和 set 在高并发环境下的性能优化秘籍，深入探讨如何利用多线程编程、锁机制优化以及数据预分配等高级技术手段，有效避免数据冲突，提高并发处理能力，实现性能的质的飞跃的专业解决

逆向-落叶

发布于 2025-02-02 21:20:28

6000

文章被收录于专栏：C++C++

序列式容器和关联式容器

前⾯我们已经接触过STL中的部分容器如：string、vector、list、deque、array、forward_list等，这些容器统称为序列式容器，因为逻辑结构为线性序列的数据结构，两个位置存储的值之间⼀般没有紧密的关联关系，⽐如交换⼀下，他依旧是序列式容器。顺序容器中的元素是按他们在容器中的存储位置来顺序保存和访问的。关联式容器也是⽤来存储数据的，与序列式容器不同的是，关联式容器逻辑结构通常是⾮线性结构，两个位置有紧密的关联关系，交换⼀下，他的存储结构就被破坏了。顺序容器中的元素是按关键字来保存和访问的。关联式容器有map/set系列和unordered_map/unordered_set系列。本章节讲解的map和set底层是红⿊树，红⿊树是⼀颗平衡⼆叉搜索树。set是key搜索场景的结构， map是key/value搜索场景的结构。

set系列的使⽤

set和multiset参考⽂档

set类的介绍

set的声明如下，T就是set底层关键字的类型

set默认要求T⽀持⼩于⽐较，如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现仿函数传给第⼆个模版参数

set底层存储数据的内存是从空间配置器申请的，如果需要可以⾃⼰实现内存池，传给第三个参数。

⼀般情况下，我们都不需要传后两个模版参数。

set底层是⽤红⿊树实现，增删查效率是O(logN) ，迭代器遍历是⾛的搜索树的中序，所以是有序的。

前⾯部分我们已经学习了vector/list等容器的使⽤，STL容器接⼝设计，⾼度相似，所以这⾥我们就不再⼀个接⼝⼀个接⼝的介绍，⽽是直接带着⼤家看⽂档，挑⽐较重要的接⼝进⾏介绍。

默认是小堆，想要大堆修改第二个参数，就是仿函数

template < class T,                   // set::key_type/value_type
     class Compare = less<T>,         // set::key_compare/value_compare仿函数
     class Alloc = allocator<T>       // set::allocator_type
     > class set;

insert和迭代器遍历使⽤样例：

有重复的值，会被去除。

下面我们可以看到，有2个5，有一个5会被去除。

插⼊⼀段initializer_list列表值，如果已经存在了，这个值就不会插入。

遍历string，是比较ascll码大小顺序遍历的。

set的构造和迭代器

set的构造我们关注以下⼏个接⼝即可。

set的⽀持正向和反向迭代遍历，遍历默认按升序顺序，因为底层是⼆叉搜索树，迭代器遍历⾛的中序；⽀持迭代器就意味着⽀持范围for，set的iterator和const_iterator都不⽀持迭代器修改数据，修改关键字数据，破坏了底层搜索树的结构。

// empty (1) ⽆参默认构造 
explicit set (const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());

// range (2) 迭代器区间构造 
template <class InputIterator>
 set (InputIterator first, InputIterator last,
 const key_compare& comp = key_compare(),
 const allocator_type& = allocator_type());

// copy (3) 拷⻉构造 
set (const set& x);

// initializer list (5) initializer 列表构造 
set (initializer_list<value_type> il,
 const key_compare& comp = key_compare(),
 const allocator_type& alloc = allocator_type());

// 迭代器是⼀个双向迭代器 
iterator -> a bidirectional iterator to const value_type

// 正向迭代器 
iterator begin();
iterator end();
// 反向迭代器 
reverse_iterator rbegin();
reverse_iterator rend();

set的增删查

set的增删查关注以下⼏个接⼝即可：

Member types
key_type -> The first template parameter (T)
value_type -> The first template parameter (T)

// 单个数据插⼊，如果已经存在则插⼊失败 
pair<iterator,bool> insert (const value_type& val);
// 列表插⼊，已经在容器中存在的值不会插⼊ 
void insert (initializer_list<value_type> il);
// 迭代器区间插⼊，已经在容器中存在的值不会插⼊ 
template <class InputIterator>
void insert (InputIterator first, InputIterator last);

// 查找val，返回val所在的迭代器，没有找到返回end() 
iterator find (const value_type& val);
// 查找val，返回Val的个数 
size_type count (const value_type& val) const;

没有找到返回end() ，end是在5的后面。

count查找数值，存在就返回1，不存在返回0

find和erase使⽤样例：

默认是升序排序-小堆，如果要删除最小数值，传begin就可以。

也可以直接删除s这个数值。不存在会返回0，存在返回1。

算法库的find是暴力查找。

// 算法库的查找 O(N) 
 auto pos1 = find(s.begin(), s.end(), x); 
 // set⾃⾝实现的查找 O(logN) 
 auto pos2 = s.find(x);

利⽤count间接实现快速查找

下面通过查找30到60的区间，然后进行删除。

multiset和set的差异

multiset和set的使⽤基本完全类似，主要区别点在于multiset⽀持值冗余，那么 insert/find/count/erase都围绕着⽀持值冗余有所差异，具体参看下⾯的样例代码理解。

multiset⽀持值冗余。

查找的话，相⽐set不同的是，x可能会存在多个，find查找中序的第⼀个。

如果要查找全部的4，就像下面这样，全部遍历等于x打印。

count会返回x的个数。

erase会把全部的x删除。

set的OJ题目

两个数组的交集

两个数组的交集题目

class Solution {
public:
    // 函数用于找到两个数组的交集，结果中的元素是唯一的
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        // 使用 set 来存储 nums1 和 nums2 中的唯一元素
        set<int> s1(nums1.begin(), nums1.end()); // 将 nums1 转换为 set s1，自动去重
        set<int> s2(nums2.begin(), nums2.end()); // 将 nums2 转换为 set s2，自动去重

        vector<int> tab; // 用于存储交集结果

        // 使用两个迭代器分别遍历 set s1 和 set s2
        auto add1 = s1.begin();
        auto add2 = s2.begin();

        // 当两个迭代器都没有到达各自 set 的末尾时继续循环
        while (add1 != s1.end() && add2 != s2.end()) {
            if (*add1 < *add2) {
                // 如果当前 s1 中的元素小于 s2 中的元素，移动 s1 的迭代器
                add1++;
            }
            else if (*add2 < *add1) {
                // 如果当前 s2 中的元素小于 s1 中的元素，移动 s2 的迭代器
                add2++;
            }
            else {
                // 如果两个元素相等，说明是交集的一部分，添加到结果 vector 中
                tab.push_back(*add1);
                // 移动两个迭代器以继续查找下一个可能的交集元素
                add1++;
                add2++;
            }
        }

        // 返回包含交集结果的 vector
        return tab;
    }
};

环形链表||

环形链表||题目

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode *detectCycle(ListNode *head) {
        //创建一个 set 用于存储已经访问过的节点
        set<ListNode*> s;
        //从第一个节点开始遍历
        ListNode* cur = head;
        //遍历链表直到当前节点为空
        while(cur)
        {
            //当前节点存在set存在，说明是带环链表
            if(s.count(cur))
            {
                //返回当前节点
                return cur;
            }
            else
            {
                //set没有这个数值，那就插入这个数值
                s.insert(cur);
            }
            cur = cur->next;
        }
        //链表无环，则返回 null
        return NULL;
    } 
};

map系列的使⽤

map和multimap参考⽂档

map类的介绍

map的声明如下，Key就是map底层关键字的类型，T是map底层value的类型，set默认要求Key⽀持⼩于⽐较，如果不⽀持或者需要的话可以⾃⾏实现仿函数传给第3个模版参数，map底层存储数据的内存是从空间配置器申请的。⼀般情况下，我们都不需要传后两个模版参数。map底层是⽤红⿊树实现，增删查改效率是 O(logN) ，迭代器遍历是⾛的中序，所以是按key有序顺序遍历的。

template < class Key,                          // map::key_type
 class T,                                      // map::mapped_type
 class Compare = less<Key>,                    // map::key_compare-仿函数
 class Alloc = allocator<pair<const Key,T> >   // map::allocator_type
> class map;

pair类型介绍

map底层的红⿊树节点中的数据，使⽤pair存储键值对数据。

下面的first和second是数值。

typedef pair<const Key, T> value_type;
template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;

    //数值元素
	T1 first;
	T2 second;

	pair() : first(T1()), second(T2())
	{}

	pair(const T1& a, const T2& b) : first(a), second(b)
	{}

	template<class U, class V>
	pair(const pair<U, V>& pr) : first(pr.first), second(pr.second)
	{}
};
template <class T1, class T2>
inline pair<T1, T2> make_pair(T1 x, T2 y)
{
	return (pair<T1, T2>(x, y));
}

构造遍历及增删查使⽤样例

initializer_list构造及迭代遍历，每个数值都会隐式类型转换成pair对象。

下面迭代器遍历，m1里存放的都是pair对象，需要访问到成员(*it).first或 it->first

second可以+=字符，first不行first是const修饰的。

第一种：直接传pair对象，

第二种：传匿名对象。

第三种：用make_pair函数。

第四种：最方便，也最常用，会隐式类型转换pair。

如果已经存在就会插入失败。

// "left"已经存在，插⼊失败 
 dict.insert({ "left", "左边，剩余" });

e要用引用接收，因为dict是对象，不用引用，会形成拷贝构造。

不修改的话，最好把const加上。

删除的话传first进行删除。

erase等接⼝跟set完全类似的。

map的构造

map的构造我们关注以下⼏个接⼝即可。

map的⽀持正向和反向迭代遍历，遍历默认按key的升序顺序，因为底层是⼆叉搜索树，迭代器遍历⾛的中序；⽀持迭代器就意味着⽀持范围for，map⽀持修改value数据，不⽀持修改key数据，修改关键字数据，破坏了底层搜索树的结构。

// empty (1) ⽆参默认构造 
explicit map(const key_compare& comp = key_compare(),
	const allocator_type& alloc = allocator_type());

// range (2) 迭代器区间构造 
template <class InputIterator>
map(InputIterator first, InputIterator last,
	const key_compare& comp = key_compare(),
	const allocator_type & = allocator_type());

// copy (3) 拷⻉构造 
map(const map& x);

// initializer list (5) initializer 列表构造 
map(initializer_list<value_type> il,
	const key_compare& comp = key_compare(),
	const allocator_type& alloc = allocator_type());

// 迭代器是⼀个双向迭代器 
iterator->a bidirectional iterator to const value_type

// 正向迭代器 
iterator begin();
iterator end();

// 反向迭代器 
reverse_iterator rbegin();
reverse_iterator rend();

map的增删查

map的增删查关注以下⼏个接⼝即可：

map增接⼝，插⼊的pair键值对数据，跟set所有不同，但是查和删的接⼝只⽤关键字key跟set是完全类似的，不过find返回iterator，不仅仅可以确认key在不在，还找到key映射的value，同时通过迭代还可以修改value。

Member types
key_type -> The first template parameter (Key)
mapped_type -> The second template parameter (T)
value_type -> pair<const key_type,mapped_type>

// 单个数据插⼊，如果已经key存在则插⼊失败,key存在相等value不相等也会插⼊失败 
pair<iterator,bool> insert (const value_type& val);

// 列表插⼊，已经在容器中存在的值不会插⼊ 
void insert (initializer_list<value_type> il);

// 迭代器区间插⼊，已经在容器中存在的值不会插⼊ 
template <class InputIterator>
void insert (InputIterator first, InputIterator last);

单个数据插入，如果key存了，那么就插入失败，key存在相等value不相等也会插⼊失败。

列表插⼊，已经在容器中存在的值不会插⼊，key存在相等value不相等也会插⼊失败。

迭代器区间插⼊，已经在容器中存在的值不会插⼊，key存在相等value不相等也会插⼊失败。

// 查找k，返回k所在的迭代器，没有找到返回end() 
iterator find (const key_type& k);
// 查找k，返回k的个数 
size_type count (const key_type& k) const;

我们可以查询对应的节点的key，然后打印value的字符出来。

下面就是一个经典的查找字典。

count查找这个是值存不存在，存在返回1，不存在返回0

map的数据修改

前⾯我提到map⽀持修改mapped_type数据，不⽀持修改key数据，如果修改关键字数据，就会破坏了底层搜索树的结构。

map第⼀个⽀持修改的⽅式时通过迭代器，迭代器遍历时或者find返回key所在的iterator修改，map 还有⼀个⾮常重要的修改接⼝operator[ ]，但是operator[ ]不仅仅⽀持修改，还⽀持插⼊数据和查找数据，所以他是⼀个多功能复合接⼝

需要注意从内部实现⻆度，map这⾥把我们传统说的value值，给的是T类型，typedef为 mapped_type。⽽value_type是红⿊树结点中存储的pair键值对值。⽇常使⽤我们还是习惯将这⾥的 T映射值叫做value。

Member types
key_type -> The first template parameter (Key)
mapped_type -> The second template parameter (T)
value_type -> pair<const key_type,mapped_type>

// 查找k，返回k所在的迭代器，没有找到返回end()，如果找到了通过iterator可以修改key对应的
mapped_type值 
iterator find (const key_type& k);

// ⽂档中对insert返回值的说明 
// The single element versions (1) return a pair, with its member pair::first 
set to an iterator pointing to either the newly inserted element or to the 
element with an equivalent key in the map. The pair::second element in the pair
 is set to true if a new element was inserted or false if an equivalent key 
already existed.

insert插⼊⼀个pair<key, T>对象

1、如果key已经在map中，插⼊失败，则返回⼀个pair对象，返回pair对象 first是key所在结点的迭代器，second是false

2、如果key不在在map中，插⼊成功，则返回⼀个pair对象，返回pair对象 first是新插⼊key所在结点的迭代器，second是true

也就是说⽆论插⼊成功还是失败，都会返回pair对象的first都会指向key所在的迭代器。

那么也就意味着insert插⼊失败时充当了查找的功能，正是因为这⼀点，insert可以⽤来实现 operator[ ]。

需要注意的是这⾥有两个pair，不要混淆了，⼀个是map底层红⿊树节点中存的pair，另⼀个是insert返回值pair。

pair<iterator,bool> insert (const value_type& val);

mapped_type& operator[] (const key_type& k);

map的迭代器和[ ]功能样例：

key没有这个数值，就会插入{ "insert" , string() }

operator [ ]返回结点中存储mapped_type值的引⽤，然后修改为左边。

下面，left已经存在了，operator [ ]返回结点中存储mapped_type值的引⽤，然后进行修改为左边、剩余。

当然也可以进行查找。

这是查询水果出现的次数，

先查找水果在不在map中，

不在，说明水果第一次出现，则插入{水果, 1}，

在，则查找到的节点中水果对应的次数++

现在可以用operator [ ]来实现水果出现的次数。

operator [ ]返回结点中存储mapped_type值的引⽤，存在就++，不存在就会插入{ "水果" , 1 }。

multimap和map的差异

multimap和map的使⽤基本完全类似，主要区别点在于multimap⽀持关键值key冗余，那么 insert/find/count/erase都围绕着⽀持关键值key冗余有所差异，这⾥跟set和multiset完全⼀样，⽐如 find时，有多个key，返回中序第⼀个。其次就是multimap不⽀持[ ]，因为⽀持key冗余，[ ]就只能⽀持插⼊了，不能⽀持修改。

map的OJ题目

随机链表的复制

数据结构初阶阶段，为了控制随机指针，我们将拷⻉结点链接在原节点的后⾯解决，后⾯拷⻉节点还得解下来链接，⾮常⿇烦。这⾥我们直接让{原结点,拷⻉结点}建⽴映射关系放到map中，控制随机指针会⾮常简单⽅便，这⾥体现了map在解决⼀些问题时的价值，完全是降维打击。

随机链表的复制题目

/*
// Definition for a Node.
class Node {
public:
    int val;
    Node* next;
    Node* random;
    
    Node(int _val) {
        val = _val;
        next = NULL;
        random = NULL;
    }
};
*/

class Solution {
public:
    Node* copyRandomList(Node* head) {
        // 创建一个哈希表，用于存储原节点与复制节点之间的映射关系
        map<Node*, Node*> nodeMap;
        Node* copyhead = nullptr; // 复制链表的头指针
        Node* copytail = nullptr; // 复制链表的尾指针

        Node* cur = head; // 指针指向当前遍历的原节点

        // 遍历原链表，复制每个节点并建立映射关系
        while(cur)
        {
            // 如果复制链表为空，初始化复制链表的头尾指针
            if(copytail == nullptr)
            {
                copyhead = copytail = new Node(cur->val);
            }
            else
            {
                // 将新节点添加到复制链表的尾部
                copytail->next = new Node(cur->val);
                copytail = copytail->next; // 更新尾指针
            }
        
            // 在哈希表中存储原节点与复制节点的映射
            nodeMap[cur] = copytail;
            cur = cur->next; // 移动到下一个原节点
        }

        // 再次遍历原链表，处理random指针
        cur = head; // 重置指针到原链表的头部
        Node* copy = copyhead; // 指针指向当前遍历的复制节点

        while(cur)
        {
            if(cur->random == nullptr)
            {
                // 如果原节点的random指针为空，复制节点的random指针也设置为空
                copy->random = nullptr;
            }
            else
            {
                // 通过哈希表找到对应的复制节点，并设置复制节点的random指针
                copy->random = nodeMap[cur->random];
            }
            cur = cur->next;       // 移动到下一个原节点
            copy = copy->next;     // 移动到下一个复制节点
        }
        return copyhead; // 返回复制链表的头指针
    }
};

前K个⾼频单词

本题⽬我们利⽤map统计出次数以后，返回的答案应该按单词出现频率由⾼到低排序，有⼀个特殊要求，如果不同的单词有相同出现频率，按字典顺序排序。

前K个⾼频单词题目

class Solution {
public:
    // 定义一个仿函数，用于比较两个 pair<string, int> 的大小
    struct con {
        bool operator()(const pair<string, int>& v1, const pair<string, int>& v2) {
            // 如果第二个元素的频率不同，按照频率从大到小排序
            if (v1.second != v2.second) {
                return v1.second > v2.second;
            }
            // 如果频率相同，按照字典序从小到大排序
            return v1.first < v2.first;
        }
    };

    // 函数：返回 words 中出现频率前 k 高的单词
    vector<string> topKFrequent(vector<string>& words, int k) {
        // 创建一个 map 来统计每个单词出现的频率
        map<string, int> frequencyMap;
        for (const auto& word : words) {
            frequencyMap[word]++; // 统计每个单词的出现次数
        }

        // 将 map 中的元素转换为 vector<pair<string, int>> 以便排序
        vector<pair<string, int>> v(frequencyMap.begin(), frequencyMap.end());

        // 使用 stable_sort 按照频率和字典序对 vector 进行排序
        stable_sort(v.begin(), v.end(), con());

        // 创建一个 vector 来存储结果
        vector<string> result;
        for (int i = 0; i < k; i++) {
            result.push_back(v[i].first); // 将前 k 个高频单词加入结果中
        }

        return result; // 返回结果
    }
};

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2025-02-01，如有侵权请联系 cloudcommunity@tencent.com 删除

并发