005 文档API

Elasticsearch核心功能解析
本文深入探讨Elasticsearch的八大核心功能,包括索引API、自动创建索引、版本控制、操作类型、自动生成ID、乐观并发控制、路由及超时设置。详细解释每个功能的使用场景和实现细节,帮助读者全面理解Elasticsearch的工作机制。

1.索引API

  下面的请求把JSON对象添加到school索引,_doc映射下。

  关于POST请求,如果存在索引,则更新;如果不存在,则添加。

1 POST school/_doc/1
2 {
3   "name":"tom1",
4   "sex":"M"
5 }
6 GET school/_doc/1

  效果:

 1 {
 2   "_index" : "school",
 3   "_type" : "_doc",
 4   "_id" : "1",
 5   "_version" : 1,
 6   "_seq_no" : 0,
 7   "_primary_term" : 1,
 8   "found" : true,
 9   "_source" : {
10     "name" : "tom1",
11     "sex" : "M"
12   }
13 }

 

2.自动创建索引

  Automatic index creation is controlled by the action.auto_create_index setting. This setting defaults to true, meaning that indices are always automatically created. Automatic index creation can be permitted only for indices matching certain patterns by changing the value of this setting to a comma-separated list of these patterns. It can also be explicitly permitted and forbidden by prefixing patterns in the list with a + or -. Finally it can be completely disabled by changing this setting to false.

  意思是:

    默认是true,会自动创建索引。

    可以配合通配符,决定哪些配置可以被创建,哪些配置不允许被创建

    可以设置false,完全禁止设置

  测试:

 1 PUT _cluster/settings
 2 {
 3     "persistent": {
 4         "action.auto_create_index": "twitter,index10,-index1*,+ind*" 
 5     }
 6 }
 7 
 8 POST ind1/dov/1
 9 {
10   "score":"10"
11 }

  说明:

    Permit only the auto-creation of indices called twitterindex10, no other index matching index1*, and any other index matching ind*. The patterns are matched in the order in which they are given.

  效果:

 1 #! Deprecation: [types removal] Specifying types in document index requests is deprecated, use the typeless endpoints instead (/{index}/_doc/{id}, /{index}/_doc, or /{index}/_create/{id}).
 2 {
 3   "_index" : "ind1",
 4   "_type" : "dov",
 5   "_id" : "1",
 6   "_version" : 1,
 7   "result" : "created",
 8   "_shards" : {
 9     "total" : 2,
10     "successful" : 1,
11     "failed" : 0
12   },
13   "_seq_no" : 0,
14   "_primary_term" : 1
15 }

  再执行:

1 POST /index11/doc/1
2 {
3   "score":"10"
4 }

  效果:

#! Deprecation: [types removal] Specifying types in document index requests is deprecated, use the typeless endpoints instead (/{index}/_doc/{id}, /{index}/_doc, or /{index}/_create/{id}).
{
  "error" : {
    "root_cause" : [
      {
        "type" : "index_not_found_exception",
        "reason" : "no such index [index11] and [action.auto_create_index] contains [-index1*] which forbids automatic creation of the index",
        "index_uuid" : "_na_",
        "index" : "index11"
      }
    ],
    "type" : "index_not_found_exception",
    "reason" : "no such index [index11] and [action.auto_create_index] contains [-index1*] which forbids automatic creation of the index",
    "index_uuid" : "_na_",
    "index" : "index11"
  },
  "status" : 404
}

  再次恢复默认:

1 PUT _cluster/settings
2 {
3     "persistent": {
4         "action.auto_create_index": "true" 
5     }
6 }

  返回:

1 {
2   "acknowledged" : true,
3   "persistent" : {
4     "action" : {
5       "auto_create_index" : "true"
6     }
7   },
8   "transient" : { }
9 }

 

3.版本控制

  ES提供了版本控制,可以通过使用版本查询参数来指定文档的特定版本。

  内部的版本控制是默认版本,从1开始,每次更新递增,包括删除。版本号可以在外部设置,不过要启用此功能,需要将version_type设置为外部。

  版本控制是一个实时的过程,不受实时搜索操作的影响。

  修改过下面的信息:

1 PUT index1/_doc/1
2 {
3   "name":"tom1",
4   "sex":"M"
5 }

  查看:

1 GET index1/_doc/1

  返回:

 1 {
 2   "_index" : "index1",
 3   "_type" : "_doc",
 4   "_id" : "1",
 5   "_version" : 2,
 6   "_seq_no" : 1,
 7   "_primary_term" : 3,
 8   "found" : true,
 9   "_source" : {
10     "name" : "tom1",
11     "sex" : "M"
12   }
13 }

  发现上面是version为2,所以,可以使用version进行过滤:

1 GET index1/_doc/1?version=2

  效果与上面的执行结果相同。

  关于版本version_type的功能,后续明白了再补充。

 

4.操作类型

  The index operation also accepts an op_type that can be used to force a create operation, allowing for "put-if-absent" behavior. When create is used, the index operation will fail if a document by that id already exists in the index.

  意思是:用于强制创建操作,如果存在,则操作失败,避免覆盖现有的文档.

  我的理解是,不会再允许创建了,version不会进行叠加了,只会报错。但是如果再去掉,马上又可以进行更新掉,version进行叠加。

1 GET /_cat/indices
2 DELETE /twitter/
3 PUT twitter/_doc/1?op_type=create
4 {
5     "user" : "kimchy",
6     "post_date" : "2009-11-15T14:12:12",
7     "message" : "trying out Elasticsearch"
8 }

  一次创建:

 1 {
 2   "_index" : "twitter",
 3   "_type" : "_doc",
 4   "_id" : "1",
 5   "_version" : 1,
 6   "result" : "created",
 7   "_shards" : {
 8     "total" : 2,
 9     "successful" : 1,
10     "failed" : 0
11   },
12   "_seq_no" : 0,
13   "_primary_term" : 1
14 }

  再次创建:

 1 {
 2   "error": {
 3     "root_cause": [
 4       {
 5         "type": "version_conflict_engine_exception",
 6         "reason": "[1]: version conflict, document already exists (current version [1])",
 7         "index_uuid": "Cp1z9uTRRhG0wIV2XiJPpQ",
 8         "shard": "0",
 9         "index": "twitter"
10       }
11     ],
12     "type": "version_conflict_engine_exception",
13     "reason": "[1]: version conflict, document already exists (current version [1])",
14     "index_uuid": "Cp1z9uTRRhG0wIV2XiJPpQ",
15     "shard": "0",
16     "index": "twitter"
17   },
18   "status": 409
19 }

 

5.自动生成ID

  The index operation can be executed without specifying the id. In such a case, an id will be generated automatically. In addition, the op_type will automatically be set to create. Here is an example (note the POST used instead of PUT)

1 ID自动生成
2 POST twitter/_doc/
3 {
4     "user" : "kimchy",
5     "post_date" : "2009-11-15T14:12:12",
6     "message" : "trying out Elasticsearch"
7 }

  结果:

 1 {
 2   "_index" : "twitter",
 3   "_type" : "_doc",
 4   "_id" : "cI7jS2wBE-J5sxKYhB25",
 5   "_version" : 1,
 6   "result" : "created",
 7   "_shards" : {
 8     "total" : 2,
 9     "successful" : 1,
10     "failed" : 0
11   },
12   "_seq_no" : 50,
13   "_primary_term" : 1
14 }

  说明:POST这种多次提交,id在一直变化,但是version不会变化。

     但是PUT,id不会变化,version一直在变。

 

6.乐观并发控制

  Index operations can be made conditional and only be performed if the last modification to the document was assigned the sequence number and primary term specified by the if_seq_no and if_primary_term parameters. If a mismatch is detected, the operation will result in a VersionConflictException and a status code of 409. See Optimistic concurrency control for more details.

  后续学习。

 

7.路由

  By default, shard placement ? or routing ? is controlled by using a hash of the document’s id value. For more explicit control, the value fed into the hash function used by the router can be directly specified on a per-operation basis using the routing parameter. For example。

  对于分片,可以进行路由控制。

POST twitter/_doc?routing=kimchy
{
    "user" : "kimchy",
    "post_date" : "2009-11-15T14:12:12",
    "message" : "trying out Elasticsearch"
}

  In the example above, the "_doc" document is routed to a shard based on the routingparameter provided: "kimchy".

  When setting up explicit mapping, the _routing field can be optionally used to direct the index operation to extract the routing value from the document itself. This does come at the (very minimal) cost of an additional document parsing pass. If the _routing mapping is defined and set to be required, the index operation will fail if no routing value is provided or extracted.

  如果显式的设置,则routing必须写才不会报错。

 

8.超时

  The primary shard assigned to perform the index operation might not be available when the index operation is executed. Some reasons for this might be that the primary shard is currently recovering from a gateway or undergoing relocation. By default, the index operation will wait on the primary shard to become available for up to 1 minute before failing and responding with an error. The timeout parameter can be used to explicitly specify how long it waits. Here is an example of setting it to 5 minutes。

  意思:索引在主分片上操作,只会等待一分钟,然后报错,可以设置参数进行显式的控制。

1 PUT twitter/_doc/1?timeout=5m
2 {
3     "user" : "kimchy",
4     "post_date" : "2009-11-15T14:12:12",
5     "message" : "trying out Elasticsearch"
6 }

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

转载于:https://www.cnblogs.com/juncaoit/p/11252225.html

标题SpringBoot智能在线预约挂号系统研究AI更换标题第1章引言介绍智能在线预约挂号系统的研究背景、意义、国内外研究现状及论文创新点。1.1研究背景与意义阐述智能在线预约挂号系统对提升医疗服务效率的重要性。1.2国内外研究现状分析国内外智能在线预约挂号系统的研究与应用情况。1.3研究方法及创新点概述本文采用的技术路线、研究方法及主要创新点。第2章相关理论总结智能在线预约挂号系统相关理论,包括系统架构、开发技术等。2.1系统架构设计理论介绍系统架构设计的基本原则和常用方法。2.2SpringBoot开发框架理论阐述SpringBoot框架的特点、优势及其在系统开发中的应用。2.3数据库设计与管理理论介绍数据库设计原则、数据模型及数据库管理系统。2.4网络安全与数据保护理论讨论网络安全威胁、数据保护技术及其在系统中的应用。第3章SpringBoot智能在线预约挂号系统设计详细介绍系统的设计方案,包括功能模块划分、数据库设计等。3.1系统功能模块设计划分系统功能模块,如用户管理、挂号管理、医生排班等。3.2数据库设计与实现设计数据库表结构,确定字段类型、主键及外键关系。3.3用户界面设计设计用户友好的界面,提升用户体验。3.4系统安全设计阐述系统安全策略,包括用户认证、数据加密等。第4章系统实现与测试介绍系统的实现过程,包括编码、测试及优化等。4.1系统编码实现采用SpringBoot框架进行系统编码实现。4.2系统测试方法介绍系统测试的方法、步骤及测试用例设计。4.3系统性能测试与分析对系统进行性能测试,分析测试结果并提出优化建议。4.4系统优化与改进根据测试结果对系统进行优化和改进,提升系统性能。第5章研究结果呈现系统实现后的效果,包括功能实现、性能提升等。5.1系统功能实现效果展示系统各功能模块的实现效果,如挂号成功界面等。5.2系统性能提升效果对比优化前后的系统性能
在金融行业中,对信用风险的判断是核心环节之一,其结果对机构的信贷政策和风险控制策略有直接影响。本文将围绕如何借助机器学习方法,尤其是Sklearn工具包,建立用于判断信用状况的预测系统。文中将涵盖逻辑回归、支持向量机等常见方法,并通过实际操作流程进行说明。 一、机器学习基本概念 机器学习属于人工智能的子领域,其基本理念是通过数据自动学习规律,而非依赖人工设定规则。在信贷分析中,该技术可用于挖掘历史数据中的潜在规律,进而对未来的信用表现进行预测。 二、Sklearn工具包概述 Sklearn(Scikit-learn)是Python语言中广泛使用的机器学习模块,提供多种数据处理和建模功能。它简化了数据清洗、特征提取、模型构建、验证与优化等流程,是数据科学项目中的常用工具。 三、逻辑回归模型 逻辑回归是一种常用于分类任务的线性模型,特别适用于二类问题。在信用评估中,该模型可用于判断借款人是否可能违约。其通过逻辑函数将输出映射为0到1之间的概率值,从而表示违约的可能性。 四、支持向量机模型 支持向量机是一种用于监督学习的算法,适用于数据维度高、样本量小的情况。在信用分析中,该方法能够通过寻找最佳分割面,区分违约与非违约客户。通过选用不同核函数,可应对复杂的非线性关系,提升预测精度。 五、数据预处理步骤 在建模前,需对原始数据进行清理与转换,包括处理缺失值、识别异常点、标准化数值、筛选有效特征等。对于信用评分,常见的输入变量包括收入水平、负债比例、信用历史记录、职业稳定性等。预处理有助于减少噪声干扰,增强模型的适应性。 六、模型构建与验证 借助Sklearn,可以将数据集划分为训练集和测试集,并通过交叉验证调整参数以提升模型性能。常用评估指标包括准确率、召回率、F1值以及AUC-ROC曲线。在处理不平衡数据时,更应关注模型的召回率与特异性。 七、集成学习方法 为提升模型预测能力,可采用集成策略,如结合多个模型的预测结果。这有助于降低单一模型的偏差与方差,增强整体预测的稳定性与准确性。 综上,基于机器学习的信用评估系统可通过Sklearn中的多种算法,结合合理的数据处理与模型优化,实现对借款人信用状况的精准判断。在实际应用中,需持续调整模型以适应市场变化,保障预测结果的长期有效性。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值