C++数据结构哈希表详解

2023年5月17日上午1:00 • 数据结构

C++数据结构哈希表详解

哈希表（Hash Table）是一种非常重要的数据结构，用于实现字典等各种应用。哈希表将关键字映射到一个固定大小的数据集合中，以支持常数时间复杂度的插入、查找和删除操作。哈希表的核心思想是将关键字通过哈希函数（Hash Function）映射到数据集合中的一个索引位置，哈希函数需要满足良好的散列性质，使得关键字能够均匀地散布在数据集合中。

哈希表的数据结构

哈希表的数据结构包含一个数组和一个哈希函数。数组用于存储数据，哈希函数用于将关键字映射到数组的索引位置。数组大小可以根据需要进行动态调整，以提高哈希表的空间利用率。

template <typename KeyType, typename ValueType>
class HashTable {
public:
  // 哈希表的构造函数
  HashTable();

  // 哈希表的析构函数
  ~HashTable();

  // 插入一个键值对
  void insert(const KeyType& key, const ValueType& value);

  // 查找一个键值对
  const ValueType* find(const KeyType& key) const;

  // 删除一个键值对
  void remove(const KeyType& key);
private:
  // 哈希表的节点结构体
  struct Node {
    KeyType key;         // 键
    ValueType value;     // 值
    Node* next;          // 指向下一个节点的指针
    Node(const KeyType& k, const ValueType& v)
        : key(k), value(v), next(nullptr) {}
  };

  std::vector<Node*> table_;          // 存储数据的数组
  int size_;                          // 哈希表中键值对的个数
  int capacity_;                      // 哈希表的容量
  const int kDefaultCapacity = 10;    // 默认的哈希表容量

  // 哈希函数，将关键字映射到一个索引位置
  int hash(const KeyType& key) const;
};

哈希函数的设计

一个好的哈希函数需要满足以下几个条件：

一致性：对于相同的输入，哈希函数总是生成相同的输出。
散列性：哈希函数需要将输入均匀地散布到输出范围内，以减少哈希冲突（Hash Collision）的发生。
易计算：哈希函数应该快速计算，以确保查找、插入和删除操作的时间复杂度为常数级别。

常用的哈希函数包括取模法、乘法哈希等，其中取模法是最简单、最常用的哈希函数之一。具体实现可以参考如下代码：

template <typename KeyType, typename ValueType>
int HashTable<KeyType, ValueType>::hash(const KeyType& key) const {
  std::hash<KeyType> hash_func;
  return hash_func(key) % capacity_;
}

哈希冲突的解决方法

哈希冲突是指将两个不同的关键字映射到同一个索引位置的情况，解决哈希冲突的方法有多种，常用的方法包括链地址法、开放地址法等。

链地址法（Chaining）是最简单也是最常用的哈希冲突解决方法，它将哈希表中每个索引位置视为一个链表的头结点，当出现哈希冲突时，只需要在对应的链表中插入新的节点即可。具体实现如下：

template <typename KeyType, typename ValueType>
void HashTable<KeyType, ValueType>::insert(const KeyType& key, const ValueType& value) {
  int index = hash(key);
  Node* node = table_[index];
  while (node != nullptr) {
    if (node->key == key) {
      node->value = value;
      return;
    }
    node = node->next;
  }
  Node* new_node = new Node(key, value);
  new_node->next = table_[index];
  table_[index] = new_node;
  ++size_;
}

示例说明1：计算单词出现频率

哈希表的应用非常广泛，下面以计算文本中每个单词出现频率为例。具体实现过程如下：

遍历文本中的每个单词，以单词为键，出现频率为值，插入哈希表中。
遍历哈希表的每个键值对，输出单词和出现频率。

void word_count() {
  std::string text =
      "This is a test of word count. This is only a test. word count is "
      "important.";
  std::istringstream iss(text);
  std::string word;
  std::unordered_map<std::string, int> freq;
  while (iss >> word) {
    ++freq[word];
  }
  for (const auto& kv : freq) {
    std::cout << kv.first << ": " << kv.second << std::endl;
  }
}

示例说明2：对数列进行去重

哈希表的另一个常见应用是对数列进行去重。具体实现过程如下：

遍历数列中的每个元素，以元素值为键，插入哈希表中。
遍历哈希表的每个键，输出去重后的数列。

void unique_numbers() {
  std::vector<int> nums = {1, 3, 2, 4, 3, 5, 1, 3};
  std::unordered_set<int> unique_nums;
  for (int num : nums) {
    unique_nums.insert(num);
  }
  for (int num : unique_nums) {
    std::cout << num << " ";
  }
}

以上是C++数据结构哈希表的详细攻略，其中涉及到了哈希表的数据结构、哈希函数的设计、哈希冲突的解决方法等核心内容。同时，给出了两条示例说明哈希表的应用场景。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：C++数据结构哈希表详解 - Python技术站

数据结构

0 0 打赏

微信扫一扫

支付宝扫一扫

C利用语言实现数据结构之队列

上一篇 2023年5月17日

数据结构与算法之并查集(不相交集合)

下一篇 2023年5月17日

Python数据结构之二叉排序树的定义、查找、插入、构造、删除

Python数据结构之二叉排序树一、定义二叉排序树（Binary Search Tree，BST），也称为二叉查找树或二叉搜索树，是一种基于二叉树的数据结构，其中每个节点都包含一个键值，且满足：左子树中所有节点的键值均小于当前节点；右子树中所有节点的键值均大于当前节点；这是一种自平衡的数据结构，可以快速地进行查找、插入、删除等操作。二、查找查找…

数据结构 2023年5月17日
000
Java面试题冲刺第十三天–数据库(3)

当我们准备面试数据库相关的职位时，需要掌握SQL语言和常见的数据库管理系统。下面是针对Java面试中可能出现的常见数据库面试题的一些攻略。 1. 数据库连接的常见方式在Java中，要与数据库连接有两种方式：JDBC和ORM框架。 (1) JDBC JDBC是Java连接数据库的标准方式，使用JDBC可以通过Java程序来连接不同的数据库。连接数据库的步骤包…

数据结构 2023年5月17日
000
JS中的算法与数据结构之链表(Linked-list)实例详解

JS中的算法与数据结构之链表(Linked-list)实例详解什么是链表？链表是计算机科学中的一种数据结构，由一系列结点(Link，也称为节点)组成，并通过每个节点中的指针(Pointer)链接在一起。每个节点包含数据和一个指向某个位置的引用。链表的主要特点是在插入和删除操作中表现出很高的效率。与数组相比，链表的访问和操作速度较慢，但在处理动态结构数据…

数据结构 2023年5月17日
000
Java矢量队列Vector使用示例

Java矢量队列Vector使用示例 Java中的Vector是一个可调整大小的数组实现，与ArrayList类似，但是可以支持同步。在需要线程安全时，可以使用Vector代替ArrayList。 Vector的创建使用Vector需要先导入Java.util.Vector类，然后可以使用以下代码创建一个Vector: Vector<Object&g…

数据结构 2023年5月17日
000
oracle 数据库学习基本结构介绍

Oracle 数据库学习：基本结构介绍攻略概述 Oracle 数据库是目前世界上使用最为广泛的一种关系型数据库。学习 Oracle 数据库需要具备一定的数据库基础知识，特别是SQL语言的使用，才能更好地理解 Oracle 数据库的基本结构。本攻略将从以下几个方面介绍 Oracle 数据库的基本结构：数据库系统组成； Oracle 实例；数据库；表空间…

数据结构 2023年5月17日
000
mosn基于延迟负载均衡算法 — 走得更快，期待走得更稳

前言这篇文章主要是介绍mosn在v1.5.0中新引入的基于延迟的负载均衡算法。对分布式系统中延迟出现的原因进行剖析介绍mosn都通过哪些方法来降低延迟构建来与生产环境性能分布相近的测试用例来对算法进行验证地址：https://github.com/mosn/mosn/pull/2253 在开始聊基于延迟的负载均衡算法之前，先介绍下什么是负载均衡——…

算法与数据结构 2023年5月8日
000
C语言数据结构哈希表详解

C语言数据结构哈希表详解什么是哈希表？哈希表（Hash Table）是一种采用散列函数（hash函数）将数据映射到一个固定长度的数组中，并且以 O(1) 的时间复杂度进行数据插入、查找、删除操作的数据结构。哈希表主要由以下三个组成部分构成：- 数组：用于存储映射到对应下标上的数据。- 散列函数：将数据映射到数组下标上的规则。- 冲突处理方式：当不同的数据…

数据结构 2023年5月16日
000
C语言数据结构之数组模拟实现顺序表流程详解

C语言数据结构之数组模拟实现顺序表流程详解什么是顺序表？顺序表是一种基于连续存储结构的数据结构，它可以用一段连续的存储单元来存储线性表中的所有元素。顺序表的实现思路顺序表的实现主要依赖数组。我们可以定义一个数组来存储线性表的数据元素，同时再定义一个变量来保存线性表当前的长度。当需要对线性表进行插入、删除、查找等操作时，根据需求，可以通过数组的下标来…

数据结构 2023年5月17日
000

C++数据结构哈希表详解

C++数据结构哈希表详解

哈希表的数据结构

哈希函数的设计

哈希冲突的解决方法

示例说明1：计算单词出现频率

示例说明2：对数列进行去重

相关文章