OrientDB使用Lucene的全文索引,并且使用中文分词器

本文详细介绍了使用Lucene全文搜索引擎进行中文和英文文本的索引创建、数据插入、精确匹配及模糊查询的方法,并展示了如何利用通配符和高亮显示增强搜索体验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# 创建表

CREATE CLASS Item;

# 创建字段

CREATE PROPERTY Item.text STRING;

#  创建索引(默认英文索引

CREATE INDEX Item.text ON Item(text) FULLTEXT ENGINE LUCENE;

#  插入数据

INSERT INTO Item (text) VALUES ('My sister is coming for the holidays.');



#  创建中文分词器

CREATE INDEX Item.text ON Item(text)
            FULLTEXT ENGINE LUCENE METADATA {
                "analyzer": "org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer"
            }


#  查询


SELECT FROM Item WHERE SEARCH_CLASS("sister") = true

# 搜索包含两个词的 

SELECT FROM Item WHERE SEARCH_CLASS("+sister +coming") = true

#  包含sister但是不包含 coming
 
SELECT FROM Item WHERE SEARCH_CLASS("+sister -coming") = true


# 通配符

SELECT FROM Item WHERE SEARCH_CLASS('meet*') = true

#  高亮


SELECT FROM City WHERE SEARCH_CLASS("+name:cas*  +description:beautiful", {
    "allowLeadingWildcard": true ,
    "lowercaseExpandedTerms": false,
    "boost": {
        "name": 2
    },
    "highlight": {
        "fields": ["name"],
        "start": "",
        "end": ""
    }
}) = true

SELECT name, $name_hl, description, $description_hl FROM City
WHERE SEARCH_CLASS("+name:cas*  +description:beautiful", {
    "highlight": {
        "fields": ["name", "description"],
        "start": "",
        "end": ""
    }
}) = true


#  指定索引搜索

SELECT FROM City WHERE SEARCH_INDEX("City.name", "cas*") = true




转载于:https://my.oschina.net/zhenruyan/blog/3097262

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值