翻译自:这里
在上一篇教程中,我们通过建模tweet作为示例,学习了如何在Dgraph中构建社交图。我们使用散列和精确索引查询tweet,并实现一个基于关键字的搜索,使用术语索引及其函数查找您喜欢的tweet。
在本教程中,我们将继续学习Dgraph中的高级文本搜索功能。
具体来说,我们将关注两个高级特性:
- 使用全文搜索搜索tweet。
- 使用正则表达式搜索搜索标签。
在我们深入之前,让我们快速回顾一下如何在Dgraph中建模tweets。
全文搜索
sorry ... 这个全文搜索暂时楼主没有开始研究, 原因暂不透漏, 哈哈
正则表达式搜索
正则表达式是表达搜索模式的强大方法。Dgraph允许您基于正则表达式搜索字符串谓词。您需要在字符串谓词上设置trigram索引,以便能够执行基于正则表达式的查询。
使用基于正则表达式的搜索,让我们匹配具有这种特定模式的所有标签:以任意长度的字符开始和结束,但以其中的子字符串graph结束。
下面是我们可以使用的正则表达式:^.graph.$
如果您不熟悉编写正则表达式,请查看这里。
让我们首先使用has()函数查找数据库中的所有标签。
{
hash_tags(func: has(hashtag)) {
hashtag
}
}
您可以看到我们总共有6个标签,其中4个标签中包含子字符串图:Dgraph、GraphQL、graphqlconf、graphDB。
我们应该使用内置函数regexp,以便能够使用正则表达式搜索谓词。这个函数有两个参数,第一个是谓词的名称,第二个是正则表达式。
下面是regexp函数的语法:regexp(predicate, /regular-expression/)
让我们执行以下查询来查找具有子字符串图的标签。
转到查询选项卡,输入查询,然后单击Run。
{
reg_search(func: regexp(hashtag, /^.*graph.*$/)) {
hashtag
}
}
哦!我们有一个错误!看起来我们忘记了在标签谓词上设置三元组索引trigram。
同样,设置trigram索引类似于设置任何其他字符串索引,让我们对hashtag谓词进行设置。
现在,让我们重新运行regexp查询。
但是结果中只有以下标签:Dgraph和graphqlconf。这是因为regexp函数在默认情况下是区分大小写的。
在regexp函数的第二个参数的末尾添加字符i,使其不区分大小写:
现在我们有了四个带有子字符串graph的标签。
让我们修改正则表达式,只匹配前缀为graph的标签。
{
reg_search(func: regexp(hashtag, /^graph.*$/i)) {
hashtag
}
}