oracle Text 全文检索功能对中文分词的支持情况

本文通过实例展示了Oracle Text在全文检索中文时,使用CHINESE_LEXER和CHINESE_VGRAM_LEXER的区别。CHINESE_LEXER能识别大部分中文单词,但分词可能不完整;CHINESE_VGRAM_LEXER虽然全面但效率较低。结论是,根据效率和准确性需求选择合适的lexer参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

下面例子在XE中测试通过。

准备工作:


CREATE   TABLE issues (
    ID         NUMBER,
    summary       VARCHAR(120),
    description   CLOB,
    author     VARCHAR(80),
    ot_version VARCHAR(10)
);


INSERT INTO issues
     VALUES (1, 'Jane', 'Text does not make tea',
             'Oracle Text is unable to make morning tea', 1);

INSERT INTO issues
     VALUES (2, 'John', 'It comes in the wrong color',
             'I want to have Text in pink', 1);

INSERT INTO issues
     VALUES (3, 'Mike', 'I come from china', '所以我讲中文', 1);
--下面两句话很难解析的
INSERT INTO issues
     VALUES (4, 'Mike', 'I come from china', '吉林省长春市的人民', 1);

INSERT INTO issues
     VALUES (5, 'Mike&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值