但是,当遇到中文时,懵逼了。。
- 第三方:ik分词器
- 下载
在Github
上搜索中文分词器:elasticsearch-analysis-ik
,这里用的版本与ES版本一致:7.5.2。
https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.2/elasticsearch-analysis-ik-7.5.2.zip
- 安装
解压至elasticsearch-7.5.2\plugins\ik
目录,ik
这个目录可以自定义名称,不用配置其他的文件,重启ES。
记得重启ES,如果没有重启,则会报错:
下图为重启后,控制台的输出,可以看到加载了ik分词器:
- 测试
- 中文
- 中英文
4. 分词模式
ik 提供了两种分词模式:ik_smart
, ik_max_word
,前面例子用的都是ik_smart
。
- ik_smart:最小切分
- ik_max_word:最细切分
显然,可看到两种方式的区别。
- 自定义分词
以“新冠病毒肺炎”为例,我想让分词器将新冠
作为一个词,由于ik分词器本身的词库中未录入这个词,我们在前面也看到了,ik分词器会将新冠
作为两个字来处理;那么,这里手动录入这个词条。
添加词条(elasticsearch-7.5.2\plugins\ik\config):这里直接写在了main.dic中。
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

文末
我将这三次阿里面试的题目全部分专题整理出来,并附带上详细的答案解析,生成了一份PDF文档
- 第一个要分享给大家的就是算法和数据结构
- 第二个就是数据库的高频知识点与性能优化
- 第三个则是并发编程(72个知识点学习)
- 最后一个是各大JAVA架构专题的面试点+解析+我的一些学习的书籍资料
还有更多的Redis、MySQL、JVM、Kafka、微服务、Spring全家桶等学习笔记这里就不一一列举出来
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门即可获取!
SQL、JVM、Kafka、微服务、Spring全家桶等学习笔记这里就不一一列举出来
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门即可获取!