
大数据
文章平均质量分 74
Crhy、Y
这个作者很懒,什么都没留下…
展开
-
Java中如何使用 tesseract-ocr 进行图片文字提取(tesseract、tesseract训练自己的字库)
Tesseract-OCR是由HP实验室开发,后由Google维护的一款开源OCR引擎。OCR是Optical Character Recognition的缩写,意为光学字符识别,是一种通过计算机软件识别印刷或手写文本的技术。Tesseract-OCR采用深度学习的方法进行文字识别,可以识别多种语言,包括英文、中文、德文、法文等。如果想要提高tesseract识别率对图片分块是一个非常好的方法,识别率提高巨大。原创 2024-07-05 16:56:46 · 2183 阅读 · 0 评论 -
(SSO单点登录)多个系统之间如何实现账号互通
背景传统 Session 机制及身份认证方案Cookie 与服务器的交互服务器端的 session 的机制基于 session 的身份认证流程集群环境下的 Session 困境及解决方案Session 共享方案多服务下的登陆困境及 SSO 方案SSO 的产生背景SSO 的底层原理 CAS最近开发新产品,然后老板说我们现在系统太多了,每次切换系统登录太麻烦了,能不能做个优化,同一账号互通掉。作为一个资深架构狮,老板的要求肯定要满足,安排!原创 2024-01-24 14:50:34 · 6313 阅读 · 4 评论 -
vue3 如何采用 App.vue定义全局变量与方法,并实现局部vue页面刷新
需求描述:两个VUE页面,A为主页面,B为子页面。现需求为,在A页面点击li数据后,B页面内容自动改变。原创 2024-01-08 16:59:03 · 2734 阅读 · 0 评论 -
ElasticSearch 集群搭建与状态监控cerebro
在单机上利用docker容器运行多个es实例来模拟es集群。部署es集群可以直接使用docker-compose来完成,但要求Linux虚拟机至少有4GI的内存空间。"number_of_replicas": 1 // 副本数。"number_of_shards": 3,// 分片款量。kibana可以监控es集群,不过新版本需要依赖es的x-pack 功能,配置比较复杂。第一种方式:利用kibana的DevTools创建索引库 ,在DevTools中输入指令。第二种方式:利用cerebro创建索引库。原创 2024-01-04 11:01:01 · 2143 阅读 · 1 评论 -
ElasticSearch 复合查询 Boolean Query
bool查询有几种逻辑关系?must:必须匹配的条件,可以理解为 "与"should:选择性匹配的条件,可以理解为 "或"must_not:必须不匹配的条件,不参与打分filter:必须匹配的条件,不参与打分。原创 2024-01-03 10:49:21 · 1534 阅读 · 0 评论 -
ElasticSearch自定义算分排序(Function Score Query)
使用 function score query,可以修改文档的相关性算分 (query score),根据新得到的算分排序。原创 2024-01-03 10:38:14 · 1762 阅读 · 0 评论 -
ElasticSearch的DSL查询语法解析
Elasticsearch提供了基于ISON的DSL (Domain Specific Lanquage)来定义查询。例如: match_query、multi_match_query。例如:geo_distance、geo_bounding_box。例如:bool、function_score。例如:ids、range、term。例如:match all。原创 2024-01-02 15:44:46 · 1760 阅读 · 0 评论 -
JavaRestClient批量导入数据
批量查询酒店数据,然后批量导入索引库中。原创 2024-01-02 14:10:16 · 465 阅读 · 0 评论 -
java中如何使用elasticsearch—RestClient操作文档(CRUD)
去数据库查询酒店数据,导入到hotel索引库,实现酒店数据的CRUD基本步骤如下。新建一个测试类,实现文档相关操作,并且完成JavaRestClient的初始化。方式一(全量更新):再次写入id一样的文档,就会删除旧文档,添加新文档。根据id查询到的文档数据是json,需要反序列化为java对象。(2)根据id查询数据库数据,并转换。方式二(局部更新):只更新部分字段。(1)创建文档对应实体。修改文档数据有两种方式。原创 2023-12-29 15:49:13 · 962 阅读 · 0 评论 -
RestClient操作索引库_删除索引库(三)
ES官方提供了各种不同语言的客户端,用来操作ES。这些客户端的本质就是组装DSL语句,通过http请求发送给ES。原创 2023-12-29 15:07:48 · 727 阅读 · 0 评论 -
RestClient操作索引库_创建索引库(二)
ES官方提供了各种不同语言的客户端,用来操作ES。这些客户端的本质就是组装DSL语句,通过http请求发送给ES。原创 2023-12-29 14:58:21 · 899 阅读 · 0 评论 -
RestClient操作索引库_准备工作(一)
ES官方提供了各种不同语言的客户端,用来操作ES。这些客户端的本质就是组装DSL语句,通过http请求发送给ES。原创 2023-12-29 11:30:48 · 999 阅读 · 0 评论 -
elasticsearch如何操作索引库里面的文档
操作索引库里面的文档原创 2023-12-27 10:37:55 · 781 阅读 · 0 评论 -
elasticsearch操作索引库
ES中通过Restful请求操作索引库、文档。请求内容用DSL语句来表示。索引库和mapping一旦创建无法修改,但是可以添加新的字段,语法如下。PUT /索引库名/_mapping。DELETE /索引库名。GET /索引库名。原创 2023-12-27 10:21:26 · 836 阅读 · 0 评论 -
定时任务部署在多台服务器时如何避免重复执行
任务以源码方式维护在调度中心,支持通过Web IDE在线更新,实时编译和生效,原理:每个 “GLUE模式(Java)” 任务的代码,实际上是“一个继承自“IJobHandler”的实现类的类代码”,“执行器”接收到“调度中心”的调度请求时,会通过Groovy类加载器加载此代码,实例化成Java对象,同时注入此代码中声明的Spring服务(请确保Glue代码中的服务和类引用在“执行器”项目中存在),然后调用该对象的execute方法,执行任务逻辑。接收“调度中心”的执行请求、终止请求和日志请求等。原创 2023-12-27 09:57:22 · 8127 阅读 · 0 评论 -
操作索引库-mapping属性
mapping常见属性有哪些?type:数据类型index:是否索引analyzer:分词器properties:子字段type常见的有哪些?字符串:text、keyword数字: long、integer、short、byte、double、float布尔:boolean日期:date对象:object。原创 2023-12-26 11:35:05 · 443 阅读 · 0 评论 -
es-ik分词器的拓展和停用字典
IK Analyzer 扩展配置原创 2023-12-26 11:17:36 · 2092 阅读 · 0 评论 -
elasticsearch 接口简单使用
进入 elasticsearch-8.11.3\bin 目录下 启动 elasticsearch.bat。浏览器访问 http://localhost:9200/ 有输出则启动成功。2.1 创建索引并创建Mapping。原创 2023-12-25 14:23:21 · 927 阅读 · 0 评论 -
elasticsearch-安装IK分词器
es在创建倒排索引时需要对文档分词,在搜索时,需要对用户输入内容分词。但默认的分词规则对中文处理并不友好,在kibana的DevTools中测试。说明plugins目录被挂载到了/var/lib/docker/volumes/es-plugins/_data这个目录。地址路径 /var/1ib/docker/volumes/es-plugins/_data。下面我们需要把课前资料中ik人词器解压缩,重命名为ik。处理中文分词,一般会使用IK分词器。原创 2023-12-25 09:54:17 · 1236 阅读 · 0 评论 -
安装elasticsearch+kibana
e ELASTICSEARCH_HOSTS=http://es:9200": 设置elasticsearch的地址,因为kibana已经与elasticsearch在一个网络,因此可以用容器名 es + 端口号,直接访问elasticsearch。在浏览器中输入: http://192.168.150.101:9200 即可看到elasticsearch的响应结果。--network es-net : 加入一个名为es-net的网络中,与elasticsearch在同一个网络中。原创 2023-12-25 09:31:07 · 1359 阅读 · 0 评论 -
elasticsearch 与 mysql的概念对比
elasticsearch是面向文档存储的,可以是数据库中的一条商品数据,一个订单信息。文档数据会被序列化为json格式后存储在elasticsearch中。原创 2023-12-22 16:10:04 · 655 阅读 · 0 评论 -
分布式搜索elasticsearch概念
elasticsearch是一款非常强大的开源搜索引擎,可以帮助我们从海量数据中快速找到需要的内容。原创 2023-12-22 15:57:17 · 2042 阅读 · 0 评论