oracle全文检索

转载自:http://blog.sina.com.cn/s/blog_613fee860100yhyz.html

 

1.需要对ctxsys用户解锁,以获得ctx_ddl包的操作权。
进入system用户,输入如下命令,解锁ctxsys用户
alter user ctxsys account unlock;
然后将ctx_ddl包的操作权限赋给ctfs用户。
也是在system用户下,输入如下命令,赋予目标用户ctx_ddl包操作权限
grant execute on ctx_ddl to ctfs;
至此,准备工作已经完成了。

2.创建分析器
这里使用chinese_vgram_lexer这个分词器,用ctfs用户登录,执行下面的命令,创建分析器。
exec ctx_ddl.create_preference(‘ctfs_lexer‘,‘chinese_vgram_lexer‘);
这句话的意思是,创建一个“chinese_vgram_lexer”分析器,名称为ctfs_lexer。

3.创建过滤词组
用ctfs用户登录,执行下面的命令,创建过滤词组
exec ctx_ddl.create_stoplist(‘ctfs_stoplist‘);
创建过滤词组成功以后,需要自定义需要过滤的词组
exec ctx_ddl.add_stopword(‘ctfs_stoplist‘,‘有限公司‘);

4.创建表索引
create index ctfs_buy_service_index on ctfs_buy_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);
create index ctfs_supply_service_index on ctfs_supply_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);

5.使用索引
select score(1),b.* from ctfs_buy_service where contains(keyword_,‘java开发‘,1)>0 order by score(1) desc;
这里的score是oracle全文检索对关键字的匹配程度所计算的分数,contains里的最后一个参数“1”就是对这个分数的一个标识

6.索引优化(用于数据变动时:添加、删除、修改)
索引同步:
exec ctx_ddl.sync_index(‘ctfs_buy_service_index‘);
exec ctx_ddl.sync_index(‘ctfs_supply_service_index‘);
索引优化:
exec ctx_ddl.optimize_index(‘ctfs_buy_service_index‘,full);
exec ctx_ddl.optimize_index(‘ctfs_supply_service_index‘,full);

7.用户输入关键词切词
要实现这种效果,需要用到oracle 10g的新特性,可以将传入的关键词先进行切词,然后在进行检索。
首先需要先创建一个POLICY过程
exec ctx_ddl.create_policy(‘ctfs_policy‘,lexer => ‘ctfs_lexer‘);

这里创建了一个名称为ctfs_policy的policy过程,分析器用到了前面创建的ctfs_lexer分析器。
写一个oracle函数,来处理关键词切词:
create or replace function p_split_chinese(p_input in varchar2)
    return varchar2
    as
        v_tab ctx_doc.token_tab;
        v_return varchar2(32767);
    begin
        ctx_doc.policy_tokens(‘ctfs_policy‘,p_input,v_tab);
        for i in 1..v_tab.count loop
            v_return := v_return||‘,‘||v_tab(i).token;
        end loop;
        return ltrim(v_return,‘,‘);
    end;
/

在plsql 中执行这个函数
select * from ctfs_buy_service where contains(keyword_,p_split_chinese(‘java开发‘),1)>0;

oracle全文检索,布布扣,bubuko.com

oracle全文检索

上一篇:基于二进制程序安装mariadb


下一篇:Oracle统计用户所有表的行数