题目
维护一个字符串集合,支持两种操作:
“I x”向集合中插入一个字符串x;
“Q x”询问一个字符串在集合中出现了多少次。
共有N个操作,输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。
输入格式
第一行包含整数N,表示操作数。
接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。
输出格式
对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗10^4
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
解题思路(Trie树的存储和查找过程讲解):
Trie 树,: 高效的存储和查找字符串集合的数据结构。
举例是见证定义的高效的方式。
例如: 在Trie中存储一系列字符串。
Code
#include <iostream>
using namespace std;
const int N = 100010;
// 每个节点的最多26, cnt表示 以第N个节点结尾字符串的个数,idx表示索引
int son[N][26], cnt[N], idx;
char str[N];
void insert(char str[])
{
int p = 0;
for(int i=0; str[i]; i++) // char str[]以'\0' 结尾,可以这样弄
{
int u = str[i] - 'a'; // 映射到0 -25
if(!son[p][u]) son[p][u] = ++idx; // 新节点
p = son[p][u];
}
cnt[p] ++;
}
int query(char str[])
{
int p = 0;
for(int i=0; str[i]; i++)
{
int u = str[i] - 'a';
if(!son[p][u]) return 0; // 不存在节点
p = son[p][u];
}
return cnt[p];
}
int main()
{
int m;
cin >> m;
while(m --)
{
char op[2];
cin >> op >> str;
if(op[0] == 'I') insert(str);
else cout << query(str) << endl;
}
// 下面是检查上面的数组的
for(int i=0; i<10; i++)
{
for(int j=0; j<26; j++)
cout << son[i][j]<< ' ';
cout << endl;
}
for(int i= 0; i<20; i++)
cout << cnt[i]<< ' ';
return 0;
}
代码理解
son[p][t] 中记录的是第某层节点是 t 的下标,不是深度,这里的p是后面根据这个去定位路径的,每一个开始遍历p = 0, 然后就是根据++idx 赋值,因为idx是唯一的,所以查询的时候可以根据这个来找字符串出现没。最后遍历到字符串结尾处,记录这个字符串出现的次数。