前⾯我们已经接触过STL中的部分容器如:string、vector、list、deque、array、forward_list等,这 些容器统称为序列式容器,因为逻辑结构为线性序列的数据结构,两个位置存储的值之间⼀般没有紧 密的关联关系,⽐如交换⼀下,他依旧是序列式容器。顺序容器中的元素是按他们在容器中的存储位 置来顺序保存和访问的。 关联式容器也是⽤来存储数据的,与序列式容器不同的是,关联式容器逻辑结构通常是⾮线性结构, 两个位置有紧密的关联关系,交换⼀下,他的存储结构就被破坏了。顺序容器中的元素是按关键字来 保存和访问的。关联式容器有map/set系列和unordered_map/unordered_set系列。 本章节讲解的map和set底层是红⿊树,红⿊树是⼀颗平衡⼆叉搜索树。set是key搜索场景的结构, map是key/value搜索场景的结构。
set的声明如下,T就是set底层关键字的类型
set默认要求T⽀持⼩于⽐较,如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现仿函数传给第⼆个模 版参数
set底层存储数据的内存是从空间配置器申请的,如果需要可以⾃⼰实现内存池,传给第三个参 数。
⼀般情况下,我们都不需要传后两个模版参数。
set底层是⽤红⿊树实现,增删查效率是O(logN) ,迭代器遍历是⾛的搜索树的中序,所以是有序 的。
前⾯部分我们已经学习了vector/list等容器的使⽤,STL容器接⼝设计,⾼度相似,所以这⾥我们 就不再⼀个接⼝⼀个接⼝的介绍,⽽是直接带着⼤家看⽂档,挑⽐较重要的接⼝进⾏介绍。
默认是小堆,想要大堆修改第二个参数,就是仿函数
template < class T, // set::key_type/value_type
class Compare = less<T>, // set::key_compare/value_compare仿函数
class Alloc = allocator<T> // set::allocator_type
> class set;
有重复的值,会被去除。
下面我们可以看到,有2个5,有一个5会被去除。
插⼊⼀段initializer_list列表值,如果已经存在了,这个值就不会插入。
遍历string,是比较ascll码大小顺序遍历的。
set的构造我们关注以下⼏个接⼝即可。
set的⽀持正向和反向迭代遍历,遍历默认按升序顺序,因为底层是⼆叉搜索树,迭代器遍历⾛的中 序;⽀持迭代器就意味着⽀持范围for,set的iterator和const_iterator都不⽀持迭代器修改数据,修改 关键字数据,破坏了底层搜索树的结构。
// empty (1) ⽆参默认构造
explicit set (const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());
// range (2) 迭代器区间构造
template <class InputIterator>
set (InputIterator first, InputIterator last,
const key_compare& comp = key_compare(),
const allocator_type& = allocator_type());
// copy (3) 拷⻉构造
set (const set& x);
// initializer list (5) initializer 列表构造
set (initializer_list<value_type> il,
const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());
// 迭代器是⼀个双向迭代器
iterator -> a bidirectional iterator to const value_type
// 正向迭代器
iterator begin();
iterator end();
// 反向迭代器
reverse_iterator rbegin();
reverse_iterator rend();
set的增删查关注以下⼏个接⼝即可:
Member types
key_type -> The first template parameter (T)
value_type -> The first template parameter (T)
// 单个数据插⼊,如果已经存在则插⼊失败
pair<iterator,bool> insert (const value_type& val);
// 列表插⼊,已经在容器中存在的值不会插⼊
void insert (initializer_list<value_type> il);
// 迭代器区间插⼊,已经在容器中存在的值不会插⼊
template <class InputIterator>
void insert (InputIterator first, InputIterator last);
// 查找val,返回val所在的迭代器,没有找到返回end()
iterator find (const value_type& val);
// 查找val,返回Val的个数
size_type count (const value_type& val) const;
没有找到返回end() ,end是在5的后面。
count查找数值,存在就返回1,不存在返回0
默认是升序排序-小堆,如果要删除最小数值,传begin就可以。
也可以直接删除s这个数值。不存在会返回0,存在返回1。
算法库的find是暴力查找。
// 算法库的查找 O(N)
auto pos1 = find(s.begin(), s.end(), x);
// set⾃⾝实现的查找 O(logN)
auto pos2 = s.find(x);
利⽤count间接实现快速查找
下面通过查找30到60的区间,然后进行删除。
multiset和set的使⽤基本完全类似,主要区别点在于multiset⽀持值冗余,那么 insert/find/count/erase都围绕着⽀持值冗余有所差异,具体参看下⾯的样例代码理解。
multiset⽀持值冗余。
查找的话, 相⽐set不同的是,x可能会存在多个,find查找中序的第⼀个。
如果要查找全部的4,就像下面这样,全部遍历等于x打印。
count会返回x的个数。
erase会把全部的x删除。
class Solution {
public:
// 函数用于找到两个数组的交集,结果中的元素是唯一的
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
// 使用 set 来存储 nums1 和 nums2 中的唯一元素
set<int> s1(nums1.begin(), nums1.end()); // 将 nums1 转换为 set s1,自动去重
set<int> s2(nums2.begin(), nums2.end()); // 将 nums2 转换为 set s2,自动去重
vector<int> tab; // 用于存储交集结果
// 使用两个迭代器分别遍历 set s1 和 set s2
auto add1 = s1.begin();
auto add2 = s2.begin();
// 当两个迭代器都没有到达各自 set 的末尾时继续循环
while (add1 != s1.end() && add2 != s2.end()) {
if (*add1 < *add2) {
// 如果当前 s1 中的元素小于 s2 中的元素,移动 s1 的迭代器
add1++;
}
else if (*add2 < *add1) {
// 如果当前 s2 中的元素小于 s1 中的元素,移动 s2 的迭代器
add2++;
}
else {
// 如果两个元素相等,说明是交集的一部分,添加到结果 vector 中
tab.push_back(*add1);
// 移动两个迭代器以继续查找下一个可能的交集元素
add1++;
add2++;
}
}
// 返回包含交集结果的 vector
return tab;
}
};
/**
* Definition for singly-linked list.
* struct ListNode {
* int val;
* ListNode *next;
* ListNode(int x) : val(x), next(NULL) {}
* };
*/
class Solution {
public:
ListNode *detectCycle(ListNode *head) {
//创建一个 set 用于存储已经访问过的节点
set<ListNode*> s;
//从第一个节点开始遍历
ListNode* cur = head;
//遍历链表直到当前节点为空
while(cur)
{
//当前节点存在set存在,说明是带环链表
if(s.count(cur))
{
//返回当前节点
return cur;
}
else
{
//set没有这个数值,那就插入这个数值
s.insert(cur);
}
cur = cur->next;
}
//链表无环,则返回 null
return NULL;
}
};
map的声明如下,Key就是map底层关键字的类型,T是map底层value的类型,set默认要求Key⽀持 ⼩于⽐较,如果不⽀持或者需要的话可以⾃⾏实现仿函数传给第3个模版参数,map底层存储数据的 内存是从空间配置器申请的。⼀般情况下,我们都不需要传后两个模版参数。map底层是⽤红⿊树实 现,增删查改效率是 O(logN) ,迭代器遍历是⾛的中序,所以是按key有序顺序遍历的。
template < class Key, // map::key_type
class T, // map::mapped_type
class Compare = less<Key>, // map::key_compare-仿函数
class Alloc = allocator<pair<const Key,T> > // map::allocator_type
> class map;
map底层的红⿊树节点中的数据,使⽤pair存储键值对数据。
下面的first和second是数值。
typedef pair<const Key, T> value_type;
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
//数值元素
T1 first;
T2 second;
pair() : first(T1()), second(T2())
{}
pair(const T1& a, const T2& b) : first(a), second(b)
{}
template<class U, class V>
pair(const pair<U, V>& pr) : first(pr.first), second(pr.second)
{}
};
template <class T1, class T2>
inline pair<T1, T2> make_pair(T1 x, T2 y)
{
return (pair<T1, T2>(x, y));
}
initializer_list构造及迭代遍历,每个数值都会隐式类型转换成pair对象。
下面迭代器遍历,m1里存放的都是pair对象,需要访问到成员(*it).first或 it->first
second可以+=字符,first不行first是const修饰的。
第一种:直接传pair对象,
第二种:传匿名对象 。
第三种:用make_pair函数。
第四种:最方便,也最常用,会隐式类型转换pair。
如果已经存在就会插入失败。
// "left"已经存在,插⼊失败
dict.insert({ "left", "左边,剩余" });
e要用引用接收,因为dict是对象,不用引用,会形成拷贝构造。
不修改的话,最好把const加上。
删除的话传first进行删除。
erase等接⼝跟set完全类似的。
map的构造我们关注以下⼏个接⼝即可。
map的⽀持正向和反向迭代遍历,遍历默认按key的升序顺序,因为底层是⼆叉搜索树,迭代器遍历⾛ 的中序;⽀持迭代器就意味着⽀持范围for,map⽀持修改value数据,不⽀持修改key数据,修改关键 字数据,破坏了底层搜索树的结构。
// empty (1) ⽆参默认构造
explicit map(const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());
// range (2) 迭代器区间构造
template <class InputIterator>
map(InputIterator first, InputIterator last,
const key_compare& comp = key_compare(),
const allocator_type & = allocator_type());
// copy (3) 拷⻉构造
map(const map& x);
// initializer list (5) initializer 列表构造
map(initializer_list<value_type> il,
const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());
// 迭代器是⼀个双向迭代器
iterator->a bidirectional iterator to const value_type
// 正向迭代器
iterator begin();
iterator end();
// 反向迭代器
reverse_iterator rbegin();
reverse_iterator rend();
map的增删查关注以下⼏个接⼝即可:
map增接⼝,插⼊的pair键值对数据,跟set所有不同,但是查和删的接⼝只⽤关键字key跟set是完全 类似的,不过find返回iterator,不仅仅可以确认key在不在,还找到key映射的value,同时通过迭代 还可以修改value。
Member types
key_type -> The first template parameter (Key)
mapped_type -> The second template parameter (T)
value_type -> pair<const key_type,mapped_type>
// 单个数据插⼊,如果已经key存在则插⼊失败,key存在相等value不相等也会插⼊失败
pair<iterator,bool> insert (const value_type& val);
// 列表插⼊,已经在容器中存在的值不会插⼊
void insert (initializer_list<value_type> il);
// 迭代器区间插⼊,已经在容器中存在的值不会插⼊
template <class InputIterator>
void insert (InputIterator first, InputIterator last);
单个数据插入,如果key存了,那么就插入失败,key存在相等value不相等也会插⼊失败 。
列表插⼊,已经在容器中存在的值不会插⼊ ,key存在相等value不相等也会插⼊失败。
迭代器区间插⼊,已经在容器中存在的值不会插⼊,key存在相等value不相等也会插⼊失败。
// 查找k,返回k所在的迭代器,没有找到返回end()
iterator find (const key_type& k);
// 查找k,返回k的个数
size_type count (const key_type& k) const;
我们可以查询对应的节点的key,然后打印value的字符出来。
下面就是一个经典的查找字典。
count查找这个是值存不存在,存在返回1,不存在返回0
前⾯我提到map⽀持修改mapped_type数据,不⽀持修改key数据,如果修改关键字数据,就会破坏了底层搜 索树的结构。
map第⼀个⽀持修改的⽅式时通过迭代器,迭代器遍历时或者find返回key所在的iterator修改,map 还有⼀个⾮常重要的修改接⼝operator[ ],但是operator[ ]不仅仅⽀持修改,还⽀持插⼊数据和查找数 据,所以他是⼀个多功能复合接⼝
需要注意从内部实现⻆度,map这⾥把我们传统说的value值,给的是T类型,typedef为 mapped_type。⽽value_type是红⿊树结点中存储的pair键值对值。⽇常使⽤我们还是习惯将这⾥的 T映射值叫做value。
Member types
key_type -> The first template parameter (Key)
mapped_type -> The second template parameter (T)
value_type -> pair<const key_type,mapped_type>
// 查找k,返回k所在的迭代器,没有找到返回end(),如果找到了通过iterator可以修改key对应的
mapped_type值
iterator find (const key_type& k);
// ⽂档中对insert返回值的说明
// The single element versions (1) return a pair, with its member pair::first
set to an iterator pointing to either the newly inserted element or to the
element with an equivalent key in the map. The pair::second element in the pair
is set to true if a new element was inserted or false if an equivalent key
already existed.
insert插⼊⼀个pair<key, T>对象
1、如果key已经在map中,插⼊失败,则返回⼀个pair对象,返回pair对象 first是key所在结点的迭代器,second是false
2、如果key不在在map中,插⼊成功,则返回⼀个pair对象,返回pair对象 first是新插⼊key所在结点的迭代器,second是true
也就是说⽆论插⼊成功还是失败,都会返回pair对象的first都会指向key所在的迭 代器。
那么也就意味着insert插⼊失败时充当了查找的功能,正是因为这⼀点,insert可以⽤来实现 operator[ ]。
需要注意的是这⾥有两个pair,不要混淆了,⼀个是map底层红⿊树节点中存的pair,另 ⼀个是insert返回值pair。
pair<iterator,bool> insert (const value_type& val);
mapped_type& operator[] (const key_type& k);
key没有这个数值,就会插入{ "insert" , string() }
operator [ ]返回结点中存储mapped_type值的引⽤,然后修改为左边。
下面,left已经存在了,operator [ ]返回结点中存储mapped_type值的引⽤,然后进行修改为左边、剩余。
当然也可以进行查找。
这是查询水果出现的次数,
先查找水果在不在map中,
不在,说明水果第一次出现,则插入{水果, 1},
在,则查找到的节点中水果对应的次数++
现在可以用operator [ ]来实现水果出现的次数。
operator [ ]返回结点中存储mapped_type值的引⽤,存在就++,不存在就会插入{ "水果" , 1 }。
multimap和map的使⽤基本完全类似,主要区别点在于multimap⽀持关键值key冗余,那么 insert/find/count/erase都围绕着⽀持关键值key冗余有所差异,这⾥跟set和multiset完全⼀样,⽐如 find时,有多个key,返回中序第⼀个。其次就是multimap不⽀持[ ],因为⽀持key冗余,[ ]就只能⽀ 持插⼊了,不能⽀持修改。
数据结构初阶阶段,为了控制随机指针,我们将拷⻉结点链接在原节点的后⾯解决,后⾯拷⻉节点还 得解下来链接,⾮常⿇烦。这⾥我们直接让{原结点,拷⻉结点}建⽴映射关系放到map中,控制随机指 针会⾮常简单⽅便,这⾥体现了map在解决⼀些问题时的价值,完全是降维打击。
/*
// Definition for a Node.
class Node {
public:
int val;
Node* next;
Node* random;
Node(int _val) {
val = _val;
next = NULL;
random = NULL;
}
};
*/
class Solution {
public:
Node* copyRandomList(Node* head) {
// 创建一个哈希表,用于存储原节点与复制节点之间的映射关系
map<Node*, Node*> nodeMap;
Node* copyhead = nullptr; // 复制链表的头指针
Node* copytail = nullptr; // 复制链表的尾指针
Node* cur = head; // 指针指向当前遍历的原节点
// 遍历原链表,复制每个节点并建立映射关系
while(cur)
{
// 如果复制链表为空,初始化复制链表的头尾指针
if(copytail == nullptr)
{
copyhead = copytail = new Node(cur->val);
}
else
{
// 将新节点添加到复制链表的尾部
copytail->next = new Node(cur->val);
copytail = copytail->next; // 更新尾指针
}
// 在哈希表中存储原节点与复制节点的映射
nodeMap[cur] = copytail;
cur = cur->next; // 移动到下一个原节点
}
// 再次遍历原链表,处理random指针
cur = head; // 重置指针到原链表的头部
Node* copy = copyhead; // 指针指向当前遍历的复制节点
while(cur)
{
if(cur->random == nullptr)
{
// 如果原节点的random指针为空,复制节点的random指针也设置为空
copy->random = nullptr;
}
else
{
// 通过哈希表找到对应的复制节点,并设置复制节点的random指针
copy->random = nodeMap[cur->random];
}
cur = cur->next; // 移动到下一个原节点
copy = copy->next; // 移动到下一个复制节点
}
return copyhead; // 返回复制链表的头指针
}
};
本题⽬我们利⽤map统计出次数以后,返回的答案应该按单词出现频率由⾼到低排序,有⼀个特殊要 求,如果不同的单词有相同出现频率,按字典顺序排序。
class Solution {
public:
// 定义一个仿函数,用于比较两个 pair<string, int> 的大小
struct con {
bool operator()(const pair<string, int>& v1, const pair<string, int>& v2) {
// 如果第二个元素的频率不同,按照频率从大到小排序
if (v1.second != v2.second) {
return v1.second > v2.second;
}
// 如果频率相同,按照字典序从小到大排序
return v1.first < v2.first;
}
};
// 函数:返回 words 中出现频率前 k 高的单词
vector<string> topKFrequent(vector<string>& words, int k) {
// 创建一个 map 来统计每个单词出现的频率
map<string, int> frequencyMap;
for (const auto& word : words) {
frequencyMap[word]++; // 统计每个单词的出现次数
}
// 将 map 中的元素转换为 vector<pair<string, int>> 以便排序
vector<pair<string, int>> v(frequencyMap.begin(), frequencyMap.end());
// 使用 stable_sort 按照频率和字典序对 vector 进行排序
stable_sort(v.begin(), v.end(), con());
// 创建一个 vector 来存储结果
vector<string> result;
for (int i = 0; i < k; i++) {
result.push_back(v[i].first); // 将前 k 个高频单词加入结果中
}
return result; // 返回结果
}
};