字符串统计 Trie树

题目

维护一个字符串集合,支持两种操作:

“I x”向集合中插入一个字符串x;
“Q x”询问一个字符串在集合中出现了多少次。
共有N个操作,输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。

输入格式
第一行包含整数N,表示操作数。

接下来N行,每行包含一个操作指令,指令为”I x”或”Q x”中的一种。

输出格式
对于每个询问指令”Q x”,都要输出一个整数作为结果,表示x在集合中出现的次数。

每个结果占一行。

数据范围
1≤N≤2∗10^4

输入样例
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例
1
0
1

解题思路(Trie树的存储和查找过程讲解):

Trie 树,: 高效的存储和查找字符串集合的数据结构。
举例是见证定义的高效的方式。
例如: 在Trie中存储一系列字符串。
字符串统计 Trie树

Code

#include <iostream>

using namespace std;

const int N = 100010;

// 每个节点的最多26, cnt表示 以第N个节点结尾字符串的个数,idx表示索引
int son[N][26], cnt[N], idx;
char str[N];

void insert(char str[])
{
    int p = 0;
    for(int i=0; str[i]; i++)   // char str[]以'\0' 结尾,可以这样弄
    {
        int u = str[i] - 'a';  // 映射到0 -25
        if(!son[p][u])  son[p][u] = ++idx;   // 新节点
        p = son[p][u];
    }
    cnt[p] ++;
}

int query(char str[])
{
    int p = 0;
    for(int i=0; str[i]; i++)
    {
        int u = str[i] - 'a';
        if(!son[p][u]) return 0;   // 不存在节点
        p = son[p][u];
    }
    return cnt[p];
}

int main()
{
    int m;
    cin >> m;
    
    while(m --)
    {
        char op[2];
        cin >> op >> str;
        if(op[0] == 'I')  insert(str);
        else cout << query(str) << endl;
    }
    
    // 下面是检查上面的数组的
    for(int i=0; i<10; i++)
    {
        for(int j=0; j<26; j++)
            cout << son[i][j]<< ' ';
       cout << endl;     
    }
    
    for(int i= 0; i<20; i++)
        cout << cnt[i]<< ' ';
    return 0;
}

代码理解

son[p][t] 中记录的是第某层节点是 t 的下标,不是深度,这里的p是后面根据这个去定位路径的,每一个开始遍历p = 0, 然后就是根据++idx 赋值,因为idx是唯一的,所以查询的时候可以根据这个来找字符串出现没。最后遍历到字符串结尾处,记录这个字符串出现的次数。

上一篇:用 JavaScript 实现单词查找树


下一篇:力扣 - 面试题 17.17. 多次搜索