solr 创建core

    core从文件结构的角度来看的话,主要包括一份索引(也可能还包括拼写检查的索引)、一堆配置文件。最主要的配置文件是:solrconfig.xml和schema.xml。solrconfig.xml从 整体上对core进行了配置,例如索引的存放路径、字段的最大长度(maxFiedlLength)、写锁的超时时间 (writeLockTimeout)、锁类型(lockType)、是否压缩索引(useCompoundFile)、内存索引缓冲区大小 (ramBufferSizeMB)、合并因子(mergeFactor)、删除策略、自动提交策略、缓存设置等,它好比是一份组装机器人的说明书,里面 详细描述了各个部件(handler)的参数。schema.xml主要是对索引的配置,例如分词器、字段名称+索引 方法+存储方式+分词方式、唯一标识字段等,它好比是机器人学习的学习方法,机器人主动或被动接受特定数据,按照配置转化成索引,然后通过其部件 (handler)展示出来,例如:search、moreLikeThis、spellCheck、factedSearcher等。

     总而言之,要使用solr首先要创建core,solr提供了非常简单的方法去创建一个core

$ bin/solr create -c <name>   //<name>是core的名称

执行完上面的命令,一个core就创建完成了,现在这个core是默认的配置,真正要投入使用还要修改配置文件。  进入到安装目录的server目录下,这里多说点,server目录可以理解成tomcat的Webapps目录,这个文件里面的文件会被发布出去。进入server文件下的solr文件,可以看到如下结构

155646_1RBQ_1860759.png

框上红框的就是你创建的core(名称跟指定的corename一致)。

进入到core目录下的conf目录,这里最主要的配置文件是solrconfig.xml和managed-schema。

solrconfig.xml配置的是solr运行时的配置,比如版本、数据目录路径、缓存策略、超时时间;

managed-schema配置的是core里面详细的字段,可以简单理解成数据库中表的描述。

 

solrconfig.xml这里不做详细的描述了,具体怎么配置网上一查就有了。managed-schema要多说一点。

managed-schema主要标签有两种,field fieldType

field标签描述core里面的字段,主要属性有name(必须)、type(fieldType类型,必须)、store(是否存储)、 docValues ( 是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的 )、index(是否创建索引)、multiValued(是否是多值)、required(是否必须)

fieldType定义类型,主要属性有name(必须)、class(必须),这两个是最常用的,除了这个还有一些其他的属性,具体用到具体查吧,需要多说一点的是fieldType标签下面还有其他的字标签,说起这些标签就要回到一个问题,这里为什么要定义类型呢?不能是其他数据库里面的那些常用的数据类型吗?别忘了solr是做什么的,solr不是一个高效的数据库,而是一个搜索引擎,solr要做的除了存储数据、索引数据之外还要做分词、同义词、评分等等的配置,这里不做过多详细的描述,等我demo写好之后再聊

转载于:https://my.oschina.net/muziH/blog/711822

在 Apache Solr 中,创建索引或核心(Core)是配置和管理搜索引擎的重要步骤。Solr 是基于 Lucene 的搜索平台,支持高效的数据索引和查询操作。以下是创建索引或核心的详细步骤: ### 创建 Solr 核心(Core) 1. **通过文件系统手动创建核心目录** 在 Solr 安装路径下的 `server/solr` 文件夹中,创建一个与核心名称相同的目录。这个目录将用于存放该核心的配置文件。例如,创建名为 `orders` 的核心目录: ```bash cd /data/solr-8.2.0 mkdir server/solr/orders ``` 该目录将作为核心的主目录,并用于存放配置文件如 `solrconfig.xml` 和 `managed-schema`[^1]。 2. **复制配置模板** 通常,Solr 提供了一个基础配置模板(通常位于 `server/solr/configsets/_default` 或类似路径下)。可以将模板内容复制到新创建的核心目录中: ```bash cp -r server/solr/configsets/_default/* server/solr/orders/ ``` 3. **使用命令行创建核心** Solr 提供了 `bin/solr` 命令行工具,可以用于创建核心。执行以下命令以创建一个名为 `orders` 的核心: ```bash bin/solr create -c orders ``` 这条命令会自动创建核心并加载配置文件。 4. **通过 Solr Admin UI 创建核心** 打开 Solr 的管理界面(通常是 `http://localhost:8983/solr`),在左侧导航栏中选择 "Core Admin",然后点击 "Add Core" 按钮。填写核心名称、实例目录等信息后,点击提交即可完成核心的创建。 5. **验证核心是否创建成功** 创建完成后,可以在 Solr Admin 界面的 "Core Selector" 中看到新创建的核心。此时可以开始向核心中添加文档、执行查询等操作。 6. **自定义配置** 如果需要进一步调整核心的配置,可以编辑核心目录下的 `solrconfig.xml` 和 `managed-schema` 文件。修改完成后,可以通过 Solr Admin 界面或命令行重新加载配置: ```bash bin/solr reload -c orders ``` 重新加载配置后,更改将生效,并且不会影响正在进行的查询操作[^2]。 ### 常见问题与注意事项 - **配置文件缺失导致核心创建失败** 在创建核心时,如果提示找不到 `solrconfig.xml` 或其他关键配置文件,则需要检查核心目录的配置是否完整。确保 `solrconfig.xml` 和 `managed-schema` 文件存在于核心目录中,否则 Solr 将无法正确加载核心[^4]。 - **倒排索引的作用** Solr 使用倒排索引来实现高效的全文搜索功能。倒排索引是一种数据结构,它将文档中的词汇映射到包含这些词汇的文档列表中。这种结构使得在大规模数据集中快速查找包含特定词汇的文档成为可能。倒排索引是 Solr 实现高性能搜索的关键机制之一[^3]。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值