oracle10g全文索引
--------------------------------------------------------------
以下是oracle10g建立全文索引的步骤,来源记不清了.
---------------------------------------------------------------
一、验证是否有ctxsys用户和ctxapp角色
登录oracle检查ctxsys用户:
$sqlplus /nolog
sql>conn / as sysdba
sql>select username from all_users;
如果没有该用户则,根据第二部安装选配件。如果已经有了这个用户,而如果是锁定状态的话,则把该用户解锁。
二、安装选配件
如果没有ctxsys用户,则在oracle用户中使用dbca安装选配件:
1,打开dbca,选择Configure Database Options
sql>$dbca
2,在以下界面中选择所有数据库组件
3,点击Next进行安装。
三、安装成功后则可以查看到有ctxsys用户和ctxapp角色
四、使用ctxsys用户登录后,授予sms用户(要建立全索引的数据库用户)执行ctx_ddl的权限
sql>conn ctxsys/sms
sql>grant execute on ctx_ddl to sms;
五、创建分词
sql>conn sms/sms
sql>
begin
ctx_ddl.create_preference ('SMS_CHINESE_LEXER', 'chinese_vgram_lexer');
end;
/
六、创建全文索引
sql> CREATE INDEX INX_CTX_QY_VCHR_ZS ON sms.yw_qy_jbxx(VCHR_ZS) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_CHINESE_LEXER');
全文索引自动同步,可以见文章
sql> CREATE INDEX INX_CTX_QY_VCHR_ZS ON sms.yw_qy_jbxx(VCHR_ZS) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_CHINESE_LEXER sync (on commit)');
七、数据同步
create or replace procedure SMS_LEXER
is
begin
ctx_ddl.sync_index('INX_CUSTOMINFO_ADDR_DOCS');
ctx_ddl.optimize_index('INX_CUSTOMINFO_ADDR_DOCS','FULL');
end;
begin
DBMS_JOB.ISUBMIT(job=>1010,what => 'begin SMS_LEXER();end;',
next_date => SYSDATE, interval => 'SYSDATE + (1/24/12)');
commit;
END;
select * from yw_qy_jbxx where contains(VCHR_LXR,'xx') > 0
--------------------------------------------------------------
以下是oracle10g全文索引常用操作.
---------------------------------------------------------------
查看表名和索引名:
select table_name,index_name from user_indexes;
查看索引字段名及其它
select INDEX_NAME,COLUMN_NAME,INDEX_OWNER from dba_ind_columns where TABLE_NAME=yourtablename;
删除索引:
drop index QYMC_TEXT;
drop index QYMC_TEXT force;
全文索引——CONTAINS 语法
我们通常在 WHERE 子句中使用 CONTAINS ,就象这样:SELECT * FROM table_name WHERE CONTAINS(fullText_column,'search contents')。
我们通过例子来学习,假设有表 students,其中的 address 是全文本检索的列。
1. 查询住址在北京的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'beijing' )
remark: beijing是一个单词,要用单引号括起来。
2. 查询住址在河北省的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"HEIBEI province"' )
remark: HEBEI province是一个词组,在单引号里还要用双引号括起来。
3. 查询住址在河北省或北京的学生
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"HEIBEI province" OR beijing' )
remark: 可以指定逻辑操作符(包括 AND ,AND NOT,OR )。
4. 查询有 '南京路' 字样的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'nanjing NEAR road' )
remark: 上面的查询将返回包含 'nanjing road','nanjing east road','nanjing west road' 等字样的地址。
A NEAR B,就表示条件: A 靠近 B。
5. 查询以 '湖' 开头的地址
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, '"hu*"' )
remark: 上面的查询将返回包含 'hubei','hunan' 等字样的地址。
记住是 *,不是 %。
6. 类似加权的查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'ISABOUT (city weight (.8), county wright (.4))' )
remark: ISABOUT 是这种查询的关键字,weight 指定了一个介于 0~1之间的数,类似系数(我的理解)。表示不同条件有不同的侧重。
7. 单词的多态查询
SELECT student_id,student_name
FROM students
WHERE CONTAINS( address, 'FORMSOF (INFLECTIONAL,street)' )
remark: 查询将返回包含 'street','streets'等字样的地址。
对于动词将返回它的不同的时态,如:dry,将返回 dry,dried,drying 等等。