前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >哈希封装unordered_map和unordered_set

哈希封装unordered_map和unordered_set

作者头像
小灵蛇
发布2024-06-06 21:34:25
810
发布2024-06-06 21:34:25
举报
文章被收录于专栏:文章部文章部

一. 哈希表的改造

咱们这里还是跟Map和Set的封装一样的道理,没有必要为了unordered_map和unordered_set传的参数不同就实例化两份代码,可以直接通过模板参数来解决。那么unordered_map传的是pair<key,value>,unordered_set传的是key。对于哈希表还有不懂的可以去看上一篇博客(http://t.csdnimg.cn/O5Vg5),对Map和Set封装还有不懂的可以去看博客(http://t.csdnimg.cn/dOSOt)。

所以咱们的代码改造成:

代码语言:javascript
复制
namespace hash_bucket
{
	template<class T>
	struct HashNode
	{
		HashNode<T>* _next;
		T _data;

		HashNode(const T& data)
			:_next(nullptr)
			, _data(data)
		{}
	};

    template<class K, class T,class KeyOfT,class Hash>
    //为了获得传参中的key,用KeyOfT仿函数
    //考虑unordered_map和unordered_set里面的元素不只是整型,所以用仿函数Hash对元素进行处理
	class HashTable
	{
		typedef HashNode<T> Node;
		
	public:

		int GetNextPrimer(int val)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
				53,			97,			193,		389,
				1543,		3079,		6151,		12289,
				49157,		98317,		196613,		393241,
				1572869,	3145739,	6291469,	12582917,
				50331653,	100663319,	201326611,	402653189,
				1610612741, 3221225473, 4294967291
			};
			for (size_t i = 0; i < __stl_num_primes; i++)
			{
				if (__stl_prime_list[i] > val)
				{
					return __stl_prime_list[i];
				}
			}
		}
		HashTable()
		{
			_tables.resize(GetNextPrimer(1), nullptr);
			_n = 0;
		}
		~HashTable()
		{
			for (size_t i = 0; i < _tables.size(); i++)
			{
				Node* cur = _tables[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
				_tables[i] = nullptr;
			}
		}
        
        //插入
		bool insert(const pair<K, V>& kv) {
			if (find(kv.first))
				return false;

			//调用仿函数的匿名对象来将key转换为整数
			size_t hashi = Hash()(kv.first) % _tables.size();
			//哈希桶头插
			Node* newNode = new Node(kv);
			newNode->next = _tables[hashi];
			_tables[hashi] = newNode;
			++_n;

			return true;
		}

		//查找
		Node* find(const K& key) {
			size_t hashi = Hash()(key) % _tables.size();
			Node* cur = _tables[hashi];
			while (cur) {
				if (cur->_kv.first == key)
				{
					return cur;
				}
				cur = cur->next;
			}
			return nullptr;
		}

		//删除
		bool erase(const K& key) {
			//由于单链表中删除节点需要改变上一个节点的指向,所以这里不能find后直接erase
			size_t hashi = Hash()(key) % _tables.size();
			Node* prev = nullptr;
			Node* cur = _tables[hashi];
			while (cur) {
				//删除还要分是否为头结点
				if (cur->_kv.first == key) {
					if (cur == _tables[hashi])
						_tables[hashi] = cur->next;
					else
						prev->next = cur->next;

					delete cur;
					--_n;
					return true;
				}

				//迭代
				prev = cur;
				cur = cur->next;
			}

			return false;
		}
        private:
		    vector<Node*> _tables;//指针数组
		    size_t _n;
    };
}

到此时我们还没有出现新的东西,一切都是在《Map和Set的封装》和《哈希开散列的实现》两个基础上结合起来的。而对迭代器的封装也是如此。

二. 迭代器的封装

我们还是采用之前的模板参数来实现,需要注意的是,由于迭代器里面要用到自定义类HashTable,而由于HashTable 我把他排版在了迭代器的下面,所以我们要先在迭代器的前面申明这个类存在,因为编译器只会向上兼容,这也是一个可以借鉴的点。而我们自定义类HashTable里面也要用到迭代器,那么反过来迭代器在类的上方,可以向上兼容,所以不用在类的前面申明了。

特别注意的是:

  1. 如果你把迭代器定义在了类HashTable的下面,就无需在迭代器的上面进行声明,而要在类HashTable的上面声明迭代器的存在。
  2. 此处迭代器要对类HashTable里面的私有成员进行访问,所以要在类HashTable里面对迭代器设置友元,使迭代器能访问私有成员。

那么类HashTable中设置友元具体是:

代码语言:javascript
复制
template<class K, class T,class KeyOfT,class Hash>
class HashTable
{
	typedef HashNode<T> Node;
	//友元让迭代器能访问私有成员
	template<class K, class T, class KeyOfT, class Hash>
	friend struct __HTIterator;

    //...
private:
	vector<Node*> _tables;//指针数组
	size_t _n;
};

此处迭代器里面值得一讲的是++操作(因为哈希表开散列的结构是单链表,所以没有必要实现--操作),我们得分情况来看,如果这个元素之后在用一个桶中还有元素,那么直接++就行;如果没有,则要依次向后找,找到下一个不为空的桶开始遍历。

代码语言:javascript
复制
//声明有HashTable这个类
template<class K, class T, class KeyOfT, class Hash>
class HashTable;
template<class K,class T,class KeyOfT,class Hash>
struct __HTIterator
{
	typedef HashNode<T> Node;
	typedef HashTable<K, T, KeyOfT, Hash> HT;
	typedef __HTIterator<K, T, KeyOfT, Hash> Self;
	Node* _node;
	HT* _ht;

	__HTIterator(Node* node,HT* ht)
		:_node(node)
		,_ht(ht)
	{}

	T& operator*()
	{
		return _node->_data;
	}

	T* operator->()
	{
		return &_node->_data;
	}
	Self& operator++()
	{
		if (_node->_next)
		{
			_node=_node->_next;
		}
		else
		{
			KeyOfT kot;
			Hash hs;
			size_t hashi = hs(kot(_node->_data)) % _ht->_tables.size();
			//下一个桶
			hashi++;
			while (hashi < _ht->_tables.size())
			{
				if (_ht->_tables[hashi])
				{
					_node = _ht->_tables[hashi];
					break;
				}
				++hashi;
			}
			if (hashi == _ht->_tables.size())
			{
				_node=nullptr;
			}
		}
		return *this;
	}

	bool operator!=(const Self& s)
	{
		return _node != s._node;
	}
};

三. 哈希表整体代码

那么我们哈希表的整体代码就是:

代码语言:javascript
复制
namespace hash_bucket
{
	template<class T>
	struct HashNode
	{
		HashNode<T>* _next;
		T _data;

		HashNode(const T& data)
			:_next(nullptr)
			, _data(data)
		{}
	};

	//声明有HashTable这个类
	template<class K, class T, class KeyOfT, class Hash>
	class HashTable;
	template<class K,class T,class KeyOfT,class Hash>
	struct __HTIterator
	{
		typedef HashNode<T> Node;
		typedef HashTable<K, T, KeyOfT, Hash> HT;
		typedef __HTIterator<K, T, KeyOfT, Hash> Self;
		Node* _node;
		HT* _ht;

		__HTIterator(Node* node,HT* ht)
			:_node(node)
			,_ht(ht)
		{}

		T& operator*()
		{
			return _node->_data;
		}

		T* operator->()
		{
			return &_node->_data;
		}
		Self& operator++()
		{
			if (_node->_next)
			{
				_node=_node->_next;
			}
			else
			{
				KeyOfT kot;
				Hash hs;
				size_t hashi = hs(kot(_node->_data)) % _ht->_tables.size();
				//下一个桶
				hashi++;
				while (hashi < _ht->_tables.size())
				{
					if (_ht->_tables[hashi])
					{
						_node = _ht->_tables[hashi];
						break;
					}
					++hashi;
				}
				if (hashi == _ht->_tables.size())
				{
					_node=nullptr;
				}
			}
			return *this;
		}

		bool operator!=(const Self& s)
		{
			return _node != s._node;
		}
	};
	template<class K, class T,class KeyOfT,class Hash>
	class HashTable
	{
		typedef HashNode<T> Node;
		//友元让迭代器能访问私有成员
		template<class K, class T, class KeyOfT, class Hash>
		friend struct __HTIterator;

	public:
		typedef __HTIterator<K, T, KeyOfT, Hash> iterator;

		int GetNextPrimer(int val)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
				53,			97,			193,		389,
				1543,		3079,		6151,		12289,
				49157,		98317,		196613,		393241,
				1572869,	3145739,	6291469,	12582917,
				50331653,	100663319,	201326611,	402653189,
				1610612741, 3221225473, 4294967291
			};
			for (size_t i = 0; i < __stl_num_primes; i++)
			{
				if (__stl_prime_list[i] > val)
				{
					return __stl_prime_list[i];
				}
			}
		}
		HashTable()
		{
			_tables.resize(GetNextPrimer(1), nullptr);
			_n = 0;
		}
		~HashTable()
		{
			for (size_t i = 0; i < _tables.size(); i++)
			{
				Node* cur = _tables[i];
				while (cur)
				{
					Node* next = cur->_next;
					delete cur;
					cur = next;
				}
				_tables[i] = nullptr;
			}
		}

		iterator begin()
		{
			for (size_t i = 0; i < _tables.size(); i++)
			{
				if (_tables[i])
				{
					//用this将HashTable传过去
					return iterator(_tables[i],this);
				}
			}
			return end();
		}

		iterator end()
		{
			return iterator(nullptr, this);
		}

		pair<iterator,bool> Insert(const T& data)
		{
			KeyOfT kot;
			iterator it = Find(data);
			if (it!=end())
			{
				return make_pair(it, false);
			}
			Hash hs;
			//负载因子到1就扩容
			if (_n == _tables.size())
			{
				//法一:采用闭散列的扩容方法--复用insert接口
				//优点:实现简单;
				//缺点:先开辟节点再释放节点代价大
				//HashTable<K, V, Hash> newHT;
				//newHT._tables.resize(_tables.size() * 2, nullptr);
				//for (size_t i = 0; i < _tables.size(); ++i) {
				//	Node* cur = _tables[i];
				//	while (cur) {
				//		newHT.insert(cur->_kv);
				//		cur = cur->next;
				//	}
				//}
				//_tables.swap(newHT._tables);

				//法二:取原表中的节点链接到当前表中
				//缺点:实现比较复杂
				//优点:不用再去开辟新节点,也不用释放旧节点,消耗小
				//不用跟开放地址法一样重新创一个HashTable对象,因为会造成指针
				//节点创建又删除
				vector<Node*> newvector(_tables.size()*2,nullptr);
				for (size_t i = 0; i < _tables.size(); i++)
				{
					Node* cur1 = _tables[i];
					while (cur1)
					{
						Node* cur2 = cur1->_next;
						size_t hashi = hs(kot(cur1->_data)) % newvector.size();
						cur1->_next = newvector[i];
						newvector[i] = cur1;
						cur1 = cur2;
					}

					//把原来的指针置空
					_tables[i] = nullptr;
				}
				_tables.swap(newvector);
			}

			size_t hashi = hs(kot(data)) % _tables.size();
			//头插不用看该位置是否为空
			Node* newnode = new Node(data);
			newnode->_next = _tables[hashi];
			_tables[hashi] = newnode;
			_n++;
			return make_pair(iterator(newnode,this), true);
		}

		iterator Find(const T& data)
		{
			KeyOfT kot;
			Hash hs;
			size_t hashi = hs(kot(data)) % _tables.size();
			Node* cur = _tables[hashi];
			while (cur)
			{
				if (hs(kot(cur->_data)) == hs(kot(data)))
				{
					return iterator(cur,this);
				}
				cur = cur->_next;
			}
			return iterator(nullptr,this);
		}
		bool Erase(const T& data)
		{
			KeyOfT kot;
			Hash hs;
			size_t hashi = hs(kot(data)) % _tables.size();
			Node* cur = _tables[hashi];
			Node* prev = nullptr;
			while (cur)
			{
				if (cur->_data == kot(data))
				{
					if (prev)
					{
						prev->_next = cur->_next;
					}
					else
					{
						_tables[hashi] = cur->_next;
					}
					delete cur;
					--_n;
					return true;
				}
				prev = cur;
				cur = cur->_next;
			}
			return false;
		}
	private:
		vector<Node*> _tables;//指针数组
		size_t _n;
	};
}

注意:由于迭代器的构造要用到HashTable,所以在HashTable类中插入操作的时候,用this返回哈希表。

四. unordered_set和unordered_map具体实现

3.1 unordered_set具体实现

那么到此时,unordered_set的具体实现已经很清楚了。这里我们要知道unordered_set里面的元素key是不能被改变的,所以为其附上const的枷锁。

代码语言:javascript
复制
//int类型
template<class K>
struct HashFunc
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};

namespace yjy
{
	template<class K,class Hash=HashFunc<K>>
	class unordered_set
	{
		struct KeyOfTSet
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	public:
	    typedef typename hash_bucket::HashTable<K,const K, KeyOfTSet, Hash>::iterator iterator;
		
		iterator begin()
		{
			return us.begin();
		}
		
		iterator end()
		{
			return us.end();
		}

		pair<iterator,bool> Insert(const K& key)
		{
			return us.Insert(key);
		}

		iterator Find(const K& key)
		{
			return us.Find(key);
		}

		bool Erase(const K& key)
		{
			us.Erase(key);
		}
		typedef hash_bucket::HashTable<K,const K, KeyOfTSet,Hash> _set;
	private:
		_set us;
	};
}

3.2 unordered_map具体实现

同样,unordered_map的具体实现已经很清楚了。这里我们要知道unordered_map的pair<key,value>里的key是不能被改变的,所以也要为其附上const的枷锁。

代码语言:javascript
复制
//int类型
template<class K>
struct HashFunc
{
	size_t operator()(const K& key)
	{
		return (size_t)key;
	}
};

namespace yjy
{
	template<class K, class V, class Hash = HashFunc<K>>
	class unordered_map
	{
		struct KeyOfTMap
		{
			const K& operator()(const pair<K, V>& kv)
			{
				return kv.first;
			}
		};
	public:
		typedef typename hash_bucket::HashTable<K, pair<const K, V>, KeyOfTMap, Hash>::iterator iterator;

		iterator begin()
		{
			return um.begin();
		}

		iterator end()
		{
			return um.end();
		}

		pair<iterator, bool> Insert(const pair<K, V>& kv)
		{
			return um.Insert(kv);
		}
		V& operator[](const K& key)
		{
			pair<iterator, bool> ret = Insert(make_pair(key,V()));
			return ret.first->second;
		}

		iterator Find(const K& key)
		{
			return um.Find(key);
		}

		bool Erase(const K& key)
		{
			um.Erase(key);
		}
		typedef hash_bucket::HashTable<K, pair<const K, V>, KeyOfTMap, Hash> _map;
	private:
		_map um;
	};
}

总结

好了,到这里今天的知识就讲完了,大家有错误一点要在评论指出,我怕我一人搁这瞎bb,没人告诉我错误就寄了。

祝大家越来越好,不用关注我(疯狂暗示)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一. 哈希表的改造
  • 二. 迭代器的封装
  • 三. 哈希表整体代码
  • 四. unordered_set和unordered_map具体实现
    • 3.1 unordered_set具体实现
      • 3.2 unordered_map具体实现
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档