
搜索
MyObject-C
从事于游戏、广告、推荐、金融交易相关后台开发
展开
-
Elasticsearch比较Solr
Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。但是Luce...转载 2018-08-01 21:16:11 · 173 阅读 · 0 评论 -
influxdb操作
增删改查安装完之后,如何启动呢? 1 sudo service influxdb start 进入命令行 1 influx 1、InfluxDB数据库操作显示数据库 1 show databases 新建数据库 1 create...转载 2019-03-06 16:44:29 · 5975 阅读 · 0 评论 -
时序数据库
背景:随着互联网的高速发展、大数据的迅速膨胀和物联网的飞速崛起,我们发现生活和工作中的大部分数据渐渐和时间产生了关联。比如微信运动的实时步数、股票每天的收盘价格、共享单车的设备状态等等。为了存储这些与时间相关的数据,积极拥抱物联网时代,各大企业纷纷推出自家的时序数据库。本文将对时序数据库的基本概念、应用场景及腾讯时序数据库CTSDB做简要介绍。什么是时序数据库...转载 2018-12-26 20:45:03 · 1289 阅读 · 0 评论 -
InfluxDB介绍
这是一个大数据爆发的时代。面对信息的激流、多元化数据的涌现,我们在获取、存储、传输、理解、分析、应用、维护大数据时,无疑需要一种便捷的信息交流通道,以便快速、有效、准确地理解和驾驭这个过程。本文将通过时序数据库(InfluxDB)+Grafana的实践,来介绍如何将数据便捷地展现出来。 一、InfluxDB 开源的分布式时序、时间和指标数据库,使用Go语言编写,无需外部依赖。其中,...转载 2018-12-05 17:03:12 · 2129 阅读 · 0 评论 -
搜索引擎架构与流程
全网搜索引擎架构与流程全网搜索的宏观架构长啥样?全网搜索的宏观流程是怎么样的?全网搜索引擎的宏观架构如上图,核心子系统主要分为三部分(粉色部分):(1)spider爬虫系统(2)search&index建立索引与查询索引系统,这个系统又主要分为两部分:一部分用于生成索引数据build_index 一部分用于查询索引数据search_index(3)rank打...转载 2018-09-10 12:39:05 · 1965 阅读 · 0 评论 -
检索需求的满足与架构演进
本文重点介绍:一、流量数据量由小到大,常见搜索方案与架构变迁二、数据量、并发量、扩展性方案三、搜索引擎的实时性架构 检索需求的满足与架构演进任何互联网需求,或多或少有检索需求,还是以58同城的帖子业务场景为例。帖子的标题,帖子的内容有很强的用户检索需求,在业务、流量、并发量逐步递增的各个阶段,应该如何实现检索需求呢?那么为了满足搜索业务的需求,随着数据量和并发量的增...转载 2018-09-10 11:36:10 · 630 阅读 · 0 评论 -
全文检索原理
一、总论根据http://lucene.apache.org/java/docs/index.html 定义:"Apache Lucene(TM) is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for ...转载 2018-09-06 20:39:17 · 492 阅读 · 0 评论 -
flume简单介绍
一:flume 的简介与功能架构1.1 flume 的简介:1.1.1 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。1.1.2当前Flume有两个版本Flume 0.9X版本的统称Flume-og...转载 2018-08-03 10:46:56 · 688 阅读 · 0 评论 -
flume官网的一些翻译
Flume NG是一个分布式、可靠、可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合、移动,最后存储到一个中心化数据存储系统中。由原来的Flume OG到现在的Flume NG,进行了架构重构,并且现在NG版本完全不兼容原来的OG版本。经过架构重构后,Flume NG更像是一个轻量的小工具,非常简单,容易适应各种方式日志收集,并支持failover和负载均衡。架构设计要点Fl...转载 2018-08-23 10:40:55 · 759 阅读 · 0 评论 -
grafana使用
接下来给大家带来一款强大的,与InfluxDB搭配使用的前端指标项展示项目–Grafana。Grafana简介grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现,基于商业友好的 Apache License 2.0 开源协议。来看一下官网上对Grafana做的定义:Grafana is most commonly used for visua...转载 2018-08-17 11:18:52 · 2863 阅读 · 0 评论 -
elasticsearch-head使用
在浏览器访问http://localhost:9100,可看到如下界面,表示启动成功: 仔细观察,我们会发现客户端默认连接的是我们elasticsearch的默认路径。而此时elasticsearch服务未启动,所以集群健康值是未连接 集群健康值的几种状态如下: 绿色,最健康的状态,代表所有的分片包括备份都可用 黄色,基本的分片可用,但是备份不可用(也可能...转载 2019-03-12 19:48:42 · 208 阅读 · 0 评论