自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 服务器间大数据文件传输怎么搞?看这篇就够了

方式一:wget 传输目标用wget将m1机器上面的 test/路径下的数据传输到m2机器指定路径。操作一、m1机器上1.打包文件进入所需传输文件的目录对文件打包,由于数据很大,这里后台执行。tar -cvf 压缩后文件.tar.gz 压缩前文件或nohup tar -cvf testfile.tar.gz test/ &2.开端口在当前路径下执行以下命令,端口号用没有被占用的,我用334451 ) python -m S...

2020-07-11 21:50:12 1633

原创 PHP 常用设计模式都不知道,怎么升级打boss呢?

前言设计模式只是为 Java 架构师准备的 —— 至少您可能一直这样认为。实际上,设计模式对于每个人都非常有用。如果这些工具不是 “架构太空人” 的专利,那么它们又是什么?为什么说它们在 PHP 应用程序中非常有用?本文解释了这些问题。设计模式不仅代表着更快开发健壮软件的有用方法,而且还提供了以友好的术语封装大型理念的方法。例如,您可以说您正在编写一个提供松散耦合的消息传递系统,也可以说你正在编写名称为观察者 的模式。用较小的示例展示模式的价值是非常困难的。这往往有些大材小用的意

2020-07-11 21:33:49 184

原创 PHP中文分词扩展

以前做过自然语言处理(nlp)的相关后端开发,之前也谈过搜索引擎Elasticsearch,它们都离不开一个基础性的工具~分词,放到Python里面也是处理文本的一个很基础常用的东西了,大致干的是这么一件事:将整句话按照一定匹配方法分成n个词语。例如:‘百度一下,你就知道’,可分为‘百度’、‘你’、‘就’、‘知道’,这几个词。由于这是个基础性工具,Python作为一个机器学习,搞nlp的首选语言,基本上是调个包的事情,但Python的痛点大家也知道~普遍效率低!当时也没拜托搞Java的同志帮忙,就琢磨P

2020-07-11 21:25:24 333

原创 Elasticsearch查询语句,远比你想象的多

前言之前谈过Elasticsearch的介绍,还有服务端和客户端的使用,这一篇该到重点了---查询语句。正所谓--无搜索,无Elasticsearch,至少,我是这么认为的。那么,ES的搜索语句有哪些呢?其实,它们比你想象中的多!一.全文本查询1) 例如:查询全部数据,按number顺序排序,并从第11条开始,取10条GET /demo/_search{ "query":{ "match_all":{ } }, "sort":[

2020-06-20 19:24:49 252

原创 Elasticsearch服务端安装有哪些坑?真相不只有一个!

一.话题背景上回做了es的基本介绍跟PHP版客户端的使用,不久后某平台里有人私信我说,兄弟,能否讲讲服务端的安装,坑老多了。。。对于这位仁兄我也是深感同情,毕竟俺也是过来人呀!之前写过 ‘迅搜’ 这款搜索引擎的介绍,其优点主要有 :资源占用少,配置坑少,有自带、开箱即用的数据导入工具等,缺点嘛,先不说了,不是本文重点,而它这些优点,本人觉得,恰好是ES的缺点了!首先,ES就是个吃货,吃内存,吃硬盘存储,硬盘方面还好,一般能管够!至于内存。。。哎!跟应用部署在同一服务器真不推荐,官方也建议--

2020-06-13 22:47:21 547

原创 被讯搜虐得怀疑人生?那是你不知道正确打开方式,收下这份笔记吧

Xunsearch (中文名:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且性能卓越能轻松处理海量数据的全文检索。它包含后端索引、搜索服务程序和前端脚本语言编写的开发工具包(称之为 SDK) 。本人看来,讯搜底层采用 C/C++ 编写,性能上不用怀疑,说到功能强大嘛。。恩,先保留着吧(毕竟现在有个如日中天的Elasticsearch),迅搜对比起es虽然功能上着实不够看,且分布式支持方面也不怎么样,客户端也主要面向PHP。。但凡是也有例外,在资源占用低和容易上手方面还是有一定突出优势的(e

2020-06-13 17:43:40 466

原创 牛逼轰轰的Elasticsearch如何入门?看这篇就够了

一。ES 扫盲ES=elasticsearch简写, Elasticsearch是一个开源的易扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。实际项目开发实战中,几乎每个系统都会有一个搜索的功能,当搜索做到一定程度时,维护和扩展起来

2020-06-11 21:47:33 252

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除