当前位置：首页 > news >正文

【C++】set 容器最全解析（什么是 set? set容器的常用接口有那些？）

news 2025/7/16 16:09:37

一、前言

二、预备知识

💢关联式容器💢

💢键值对💢

💢树型结构的关联式容器💢

三、set 详解

🔥 什么是 set ?

🔥set 模板参数列表

🔥set 的构造

🔥set 的使用

🍋insert

🍓find

🍇erase

🥝swap

🍐 empty

🍒size

🍈count

🍌 lower_bound

🍍upper_bound

🍉set 的降序使用

🔥set 的特点

🔥set 和 vector 的对比

四、常考面试题

五、共勉

一、前言

set 是 STL 中的容器之一，不同于普通容器，它的查找速度极快，常用来存储各种经常被检索的数据，因为容器的底层是平衡二叉搜索树中的红黑树。除此之外，还可以借助其特殊的性质，解决部分难题

二、预备知识

在正式学习 set 之前，首先要有一些预备知识，否则后面可能看不懂相关操作

💢关联式容器💢

在以往的【STL 容器】学习中，我们接触到的都是 序列式容器，比如 string、vector、list、deque 等，序列式容器的特点就是 底层为线性序列的数据结构，就比如 list，其中的节点是 线性存储 的，一个节点存储一个元素，其中存储的元素都可序，但未必有序

【关联式容器】 则比较特殊，其中存储的是 <key, value> 的 键值对，这就意味着可以按照 键值大小 key 以某种特定的规则放置于适当的位置，关联式容器 没有首尾的概念，因此没有头插尾插等相关操作，本文中学习的 set 就属于 关联式容器

注意： stack、queue 等适配器也属于序列式容器，因为他们的底层是 deque 等容器

💢键值对💢

【键值对】是一种用来表示具有一一对应关系的结构，该结构中一般只包含两个成员变量：key 和 value，前者表示键值，后者表示实值关联式容器的实现离不开【键值对】

因此在标准库中，专门提供了这种结构 pair 定义如下：

//SGI 版 STL 中的实现
template <class T1, class T2>
struct pair {typedef T1 first_type;typedef T2 second_type;T1 first;	T2 second;	pair() : first(T1()), second(T2()) {}pair(const T1& a, const T2& b) : first(a), second(b) {}#ifdef __STL_MEMBER_TEMPLATEStemplate <class U1, class U2>pair(const pair<U1, U2>& p) : first(p.first), second(p.second) {}
#endif
};

pair 中的 first 表示键值，second 则表示实值，在给【关联式容器】 中插入数据时，可以构建 pair 对象

比如下面就构建了一个 键值 key 为 string，实值 value 为 int 的匿名键值对 pair 对象

pair<string, int>("hehe", 123);

可以将此匿名对象传入 关联式容器 中，当然这样写未免过于麻烦了，于是库中设计了一个函数模板 make_pair，可以根据传入的参数，去调用 pair 构建对象并返回

make_pair("hehe", 123);	//构建出的匿名对象与上面的一致

make_pair 的定义如下所示：

template <class T1,class T2>
pair<T1,T2> make_pair (T1 x, T2 y)
{return ( pair<T1,T2>(x,y) );
}

该函数实际会被编译器优化为 内联函数，因此不会造成过多消耗，可以放心使用

💢树型结构的关联式容器💢

所以在 C++ 标准中，共提供了四种 树型结构的关联式容器

set
multiset
map
multimap

关于 哈希结构的关联式容器 将在 哈希表 中学习

树型结构与哈希结构的关联式容器功能都是一模一样的，不过哈希结构查找比树型结构快得多 -> O(1)

注：

STL 中选择的树型结构为红黑树 RB-Tree
树型结构中的元素中序遍历后有序，而哈希结构中的元素无序

三、set 详解

🔥 什么是 set ?

【set】是按照一定顺序存储的容器

在 set 中，元素的 value 也标识它（value就是key，类型为T），并且每个value必须是唯一的。set中的元素不能在容器中修改（元素总是 const 类型），但是可以从容器中插入或者删除它们。
在内部，set 中的元素总是按照其内部比较对象（类型为Compare）所指示的特定严格弱排序准则进行排序。
set 容器通过 key 访问单个元素的速度比 unordered_set 容器慢，但 set 容器允许根据顺序对子集进行直接迭代
set 在底层是用二叉搜索树（红黑树）实现的。

注意点：

set 中插入元素时，只需要插入 value 即可，不需要构造键值对
set 中的元素不可以重复（因此可以使用 set 去重）
使用 set 的迭代器遍历 set 中的元素，可以得到有序序列
set 中的元素默认按照升序来排序
set 中的查找某个元素，时间复杂度为：log N
与 map/multimap不同，map/multimap 中存储的时真正的键值对 <key，value>，set 中只放 value，但是底层实际存放的是由 <key，value> 构成的键值对
set 中的元素不允许修改，因为 set 在底层是用二叉搜索树来实现的，若是二叉搜索树当中的某个元素值进行了修改，那么这棵树将不再是二叉查找树。

🔥set 模板参数列表

如下图所示：

T ： set中存放元素的类型，实际在底层存储 <value, value> 的键值对。
Compare ：set中元素默认按照小于来比较。
Alloc ：set中元素空间的管理方式，使用STL提供的空间配置器管理。

🔥set 的构造

这里主要有三种方式：

（1）无参构造空容器

set<int> s1; // 构造一个int类型的空容器

（2）拷贝构造某类型容器

set<int> s2(s1); // 拷贝构造int类型s1容器的复制品

（3）使用迭代器区间进行初始化构造

vector<int> v1 = { 1,2,3,4,5 };
set<int> s3(v1.begin(), v1.end()); // 构造vector对象某段区间的复制品

🔥set 的使用

set的成员函数主要分为：迭代器，容量操作，修改操作。

需要注意的是，对于 set 而言，它的普通迭代器和const迭代器都不支持修改。

我这里只举几个常用的，其它可以看文档学习。

🍋insert

在 set 中插入元素 val ，实际插入的是 <val，val> 构成的键值对

如果插入成功，返回 <val在set中的位置， true>
如果插入失败，说明 val 在set中已经存在,返回 <val在set中的位置， false>

代码示例：

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(2);s.insert(1);s.insert(3);s.insert(3);// 遍历for (auto e : s){cout << e << " ";}
}

可以看到当插入元素重复元素时，set 会自动过滤掉，并对已有的元素进行排序

🍓find

在容器中搜索查找 val 元素，如果找到，则返回一个迭代器，否则返回 set::end 的迭代器

代码示例：

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(2);s.insert(1);s.insert(3);s.insert(3);set<int>::iterator pos = s.find(5);if (pos != s.end()){cout << "找到了" << endl;}
}

🍇erase

删除 set 中的元素，这里有3种删除方式

（1）从 set 容器中删除单个元素（搭配 find 使用）

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(6);s.insert(3);s.insert(8);s.insert(7);auto pos = s.find(5);if (pos != s.end()){s.erase(pos); // 删除元素5cout << "删除成功" << endl;}else{cout << "删除失败" << endl;}// 遍历for (auto e : s){cout << e << " ";}
}

（2）从set 容器中删除单个元素（直接传入要删除的元素）

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(6);s.insert(3);s.insert(8);s.insert(7);s.erase(5);// 遍历for (auto e : s){cout << e << " ";}
}

那么它和第1种的区别是什么呢?

erase(x) ：如果x存在就删除；如果不存在，不做任何改变
erase(pos) ：如果x存在就删除;如果不存在，此时pos位置指向set::end的迭代器，那么程序运行就会报错。

实这种方式本质上可以理解为 erase 去调用了迭代器和 find 。

(3) 从 set 容器中删除一组元素（传的是迭代器区间【first，last)）

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(6);s.insert(3);s.insert(8);s.insert(7);auto pos = s.find(5);if (pos != s.end()){s.erase(pos, s.end()); // 从5开始所有的元素全部删除cout << "删除成功" << endl;}else{cout << "删除失败" << endl;}// 遍历for (auto e : s){cout << e << " ";}
}

可以看到从 5 开始所有的元素都已经被删除了

🥝swap

交换 set 容器中的元素

void testset()
{set<int> s1;s1.insert(4);s1.insert(5);s1.insert(2);s1.insert(1);set<int> s2;s2.insert(6);s2.insert(3);s2.insert(8);s2.insert(7);s1.swap(s2);cout << "s1:";// 遍历for (auto e1 : s1){cout << e1 << " ";}cout << "s2:";// 遍历for (auto e2 : s2){cout << e2 << " ";}
}

可以看到 s1 和 s2 的元素已经被交换了

🍐 empty

判断 set 容器是否为空，空返回 ture，非空飞回 false

void testset()
{set<int> s1;s1.insert(4);s1.insert(5);s1.insert(2);s1.insert(1);set<int> s2;cout << s1.empty() << endl; // s1容器不为空,输出0cout << s2.empty() << endl; // s2容器为空,输出1
}

🍒size

返回 set 中的有效元素个数

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(6);s.insert(3);s.insert(8);s.insert(7);// 打印元素个数cout << s.size() << endl;
}

🍈count

返回 set 中值为 x 的元素的个数

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(6);s.insert(3);s.insert(8);s.insert(7);// 元素3的个数cout << s.count(3) << endl;// 元素7的个数cout << s.count(10) << endl;
}

这个接口对于 set 容器其实没有太大用处，因为 set 当中每个value 都是唯一的

🍌 lower_bound

返回一个指向容器中第一个元素的迭代器，该迭代器不被认为在val之前(它是等于或在val之后)

其实就是，返回大于等于val位置的迭代器。

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(3);s.insert(8);s.insert(7);// 如果3存在就返回3位置的迭代器auto lowIt = s.lower_bound(3);cout << *lowIt << endl;// 如果6不存在就返回比6大的位置的迭代器lowIt = s.lower_bound(6);cout << *lowIt << endl;
}

代码示例二：

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(3);s.insert(8);s.insert(7);// 删除大于等于4的所有值auto lowIt = s.lower_bound(4);s.erase(lowIt, s.end());// 遍历for (auto e : s){cout << e << " ";}
}

可以看到所有大于等于 4 的都被删除了

🍍upper_bound

返回指向容器中第一个元素的迭代器，该元素被认为是val之后的元素。

也就是说，不管val存在还是不存在，都返回比val大的那个值。

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(1);s.insert(3);s.insert(8);s.insert(7);// 如果3存在就返回大于3位置的迭代器auto lowIt = s.upper_bound(3);cout << *lowIt << endl;// 如果6不存在就返回比6大的位置的迭代器lowIt = s.upper_bound(6);cout << *lowIt << endl;
}

其实，lower_bound 和 upper_bound 可以搭配使用，删除元素中间的一段区间

void testset()
{set<int> s;// 插入元素s.insert(4);s.insert(5);s.insert(2);s.insert(6);s.insert(1);s.insert(3);s.insert(8);s.insert(7);// 删除 [3, 7] 这段区间中的所有数auto leftIt = s.lower_bound(3); // 返回3位置的迭代器auto rightIt = s.upper_bound(7); // 返回8位置的迭代器s.erase(leftIt, rightIt);// 遍历for (auto e : s){cout << e << " ";}
}

注意：erase 删除的迭代器区间是左闭右开，也就是说 right 是 8 位置的迭代器，但是 erase 只会删除到 7。

🍉set 的降序使用

可以通过改变 set 模板参数2的方式，改变其中的顺序为降序

#include <iostream>
#include <vector>
#include <set>
using namespace std;int main()
{vector<int> arr = { 7,3,6,9,3,1,6,2 };set<int, greater<int>> s1(arr.begin(), arr.end());for (auto e : s1)cout << e << " ";return 0;
}

🔥set 的特点

set 具有以下特点：

🔥set 和 vector 的对比

vector 是一个动态数组，它允许存储重复的元素，且元素存储的顺序是按插入顺序排列的

插入操作：在 vector 的末尾插入元素的时间复杂度为 O(1)，但如果你想在 vector 的中间插入元素，则需要 O(n) 的时间来移动元素。
查找操作：在 vector 中查找元素通常需要 O(n) 的时间（除非你自己进行排序并使用二分查找）。

set 是一个集合，它自动去重并保持元素的有序性

插入操作：在 set 中插入元素的时间复杂度为 O(log n)，并且插入后元素自动排序。
查找操作：在 set 中查找元素的时间复杂度为 O(log n)，比 vector 中的线性查找要高效得多。

使用场景

vector 适用于需要频繁访问元素并且不关心元素顺序的场景，比如用来存储一组数据，然后你可以遍历、访问这些数据。
set 适用于需要存储唯一元素且需要快速查找或顺序访问的场景，比如你需要维护一个不重复的、有序的数据集合

四、常考面试题

题目：两个数组的交集

链接：349. 两个数组的交集 - 力扣（LeetCode）

解题思路：

对于求交集、并集、差集，其实有一种特定的方法，如下图所示：

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {// 去掉num1当中重复的元素并排序set<int> s1;for (auto e1 : nums1){s1.insert(e1);}// 去掉num2当中重复的元素并排序set<int> s2;for (auto e2 : nums2){s2.insert(e2);}vector<int> ret; // 存放交集auto it1 = s1.begin(); // 指向s1的起始位置auto it2 = s2.begin(); // 指向s2的起始位置while (it1 != s1.end() && it2 != s2.end()) // 当s1和s2都没有遍历完时{if (*it1 < *it2) {it1++;}else if (*it2 < *it1){it2++;}else // 当it1和it2指向的元素相等时,就是交集{ret.push_back(*it1); // 把元素尾插到ret中,然后同时向后挪动it1++;it2++;}}return ret; // 返回交集}
};