自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 大数据之数据仓库压缩处理

大数据之数据仓库压缩处理流程

2023-02-02 17:02:39 613

转载 HANA语法大全

hana语法大全

2023-01-11 10:20:48 491

转载 Spark常见错误问题汇总

https://www.cnblogs.com/tesla-turing/p/13451769.html

2022-06-29 17:43:31 235

原创 CDH6.x,各组件对应的版本号

CDH6.x,各组件对应的版本号https://docs.cloudera.com/documentation/enterprise/6/release-notes/topics/rg_cdh_63_packaging.html

2022-03-25 17:33:51 1910

原创 elasticsearch动态配置

elasticsearch配置集群和节点的配置类型动态类型1.使用API设置或更新正在运行的集群的动态配置。2.elasticsearch.yml文件配置动态配置3.使用集群设置API进行更新可以是持久的,适用于集群重新启动,也可以是暂时的,集群重启后失效。可以指定设置一个null应用在动态更新API上,去重置永久或临时设置。4.相同配置参数优先级(高到底)1)临时设置(API)2)持久设置(API)3)elasticsearch.yml setting4)默认配置静态类型1.静

2021-06-25 17:56:32 1300

原创 elasticsearch之自定义IK分词器词库(二)

一、引言上篇博客主要介绍了,IK分词器的安装和使用,这篇章我们来谈谈如何构建定制的词库,来满足复杂的业务需求。二、本地自定义词库安装首先我们在elasticsearch-6.3.1/plugins/ik/config 目录下创建一个自己的文件xxx.dic在xxx.dic写入需要分词的词或短语,如下案例所示vim elasticsearch-6.3.1/plugins/ik/config/IKAnalyzer.cfg.xml,配置本地词库重启ES生效测试效果三

2021-04-22 16:19:36 7313

原创 elasticsearch之IK分词器安装使用(一)

一、背景elasticsearch自带的分词器对中文分词支持不是特别友好,在公司的一些业务场景中如果使用elasticsearch自带的分词器,在搜索应用中经常会匹配不上自己所需要的信息。二、主流分词器介绍常见的一些开源分词器对比分词器优势劣势Smart Chinese Analysis官方自带分词效果较差IKAnalyzer支持自定义词典词库需要自行维护,不支持词性识别结巴分词新词识别功能不支持词性识别Ansj中文分词分词精准度不错,支持词性识

2021-04-22 16:15:04 6909

原创 kafka性能调优(生产环境)

一、前言前段时间,公司项目测试,测试组发现kafka topic数据与发送量不一致,后来查看日志发现报了这个错误。Got error produce response with correlation id xxx on topic-partition xxxxx, retrying (9 attempts left). Error: NETWORK_EXCEPTIONGot error produce response with correlation id xxx on topic-partiti

2021-04-20 10:23:48 16047

原创 Hbase协处理器构建二级索引(Elasticsearch存储)

一、HBase协处理器简介协处理器介绍二、实现思路2.1 Observer协处理器部分函数介绍(后续将使用这两个函数实现二级索引)postPut:该函数在 put 操作执 行后会被 Region Server 调用postDelete:该函数将在执行删除后被Region Server 调用思路:1.使用Elasticsearch作为索引库2.我们可以利用postPut回调函数,在往hbase插入数据时,执行Elasticsearch插入操作3.我们可以利用 postDelete回

2021-04-14 10:31:38 7190

原创 Spark Streaming 实时写入Hive

一、背景公司Flume版本过低,使用Flume时有数据丢失问题,但是暂时不方便更新框架。所以使用Spark Streaming替代Flume实现入库Hive功能。二、流程图Created with Raphaël 2.2.0kafkaSpark StreamingETLhive三、代码实现pom文件<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0"

2021-02-01 17:06:08 10089 1

原创 为什么 byte的表数范围是 -128 ~ 127?(详尽解析)

问题: 为什么 byte的表数范围是 -128 ~ 127答:首先引出三个概念:原码:二进制表示数字,高位表示正负。反码:中间格式用于计算补码。 正数不变,负数,高位不变,其他位0置1,1置0。补码;计算机的数据都是以补码形式进行计算的(规定)。计算时,计算机会将原码转化为补码后进行计算。规则:正数不变,负数,高位不变在反码的基础上加1。总结:正数 原码、反码、补码相同。 负数,高位都不变,反码0置1,1置0,补码在反码基础上加1。解题:byte有八位 可以表

2020-09-02 17:16:57 967 2

原创 冒泡排序与二分发查找代码与解析

冒泡排序public class Arryss { public static void main(String[] args) { int [] num = {2,5,33,21,32,47,23,17}; //创建一个无序数组 for (int i = 0; i &amp;amp;lt; num.length-1; i++) { //外层循环决定遍历几轮 for (int j...

2019-03-16 23:04:24 254

原创 前++ 后++ 前- - 后--的理解

1. 前++java中前加加的运算顺序是 先自加一再做运算:第一个例子 :做的是赋值运算int a = 10;int b = ++a;这里的b是等于11;运算过程是a先加1,然后再将a的值赋值b;第二个例子:做的是比较运算int a = 9;int b = 10;System.out.println (++a ==b);这里的运行结果是ture; 很简单a先自加一 然后做...

2019-03-15 00:36:05 1097

原创 JDK、MAVEN环境搭建

写在前面:这篇博客是我第一篇博客,以后也会继续写,写博客主要是为两点:1、为了分享JAVA的知识2、为了巩固自己所学的如果你是完全和答主之前一样完全不懂得java的小白选手,那么我们得先了解JDK是什么?JDK是java的开发环境集成环境,其中包涵JRE和JVM.简单来说JDK就是可以让你的电脑编写和运行JAVA的必要环境。所以想学JAVA第一步必须是先搭建环境JDK的安装废话...

2019-03-09 00:48:12 327

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除