Hbase的 KeyValue Class

最新推荐文章于 2024-07-20 00:48:56 发布

转载最新推荐文章于 2024-07-20 00:48:56 发布 · 3.4k 阅读

hadoop 专栏收录该内容

56 篇文章

订阅专栏

本文深入解析了KVComparator在Hadoop中用于比较KeyValue对象的过程，包括rowkey、columnfamily、family+qualifier、timestamp和memstoreTS的排序规则，以及如何通过这些排序实现高效的扫描操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考 http://iwinit.iteye.com/blog/1827527

引用：

KVComparator的KeyValue对象比较过程

1.使用KeyComparator比较rowkey，结果是rowkey字节序从小到大

2.如果rowkey一样，则按column family比较，结果是column family字节序从小到大

3.如果column family一样，则按family+qualifier比较，结果是qualifier字节序从小到大

4.如果qualifier也一样，则按timestamp排序，结果是timestamp从大到小排序

5.如果timestamp也一样，则按type排序，delete在put之前

6.以上都一样，则按照memstoreTS排序，memstoreTS是原子递增id，不可能一样，结果是memstoreTS从大到小排序，越新的修改会排前面，方便scan

可见KeyValue对象在内存里其实是已经排序好了，flush生成文件的时候，只是简单的scan一下，设置maxVersion(在这里超过maxVersion的put自动失效了)，将每个KeyValue对象写入HDFS

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

maixia24

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Could not find a deserializer for the Value class: 'org.apache.hadoop.hbase.client.Result

杨鑫newlife的专栏

04-21

1275

最近在写Spark读取Hbase导出的文件时，常遇到这个问题，报错找不到'org.apache.hadoop.hbase.client.Result。试了很多种办法，最后是在代码中添加如下：hbaseConf.setStrings("io.serializations",newString[]{hbaseConf.get("io.serializations"), MutationSerializ...

如何封装一个线程安全、可复用的 HBase 查询模板

最新发布

张彦峰的博客

05-02

3万+

本文探讨了如何封装一个线程安全、可复用的 HBase 查询模板。通过引入基于 AtomicReference 的连接懒加载机制和函数式接口封装查询执行逻辑，本文提供了一种高效的 HBase 查询解决方案。文章详细阐述了 HBase 连接池的实现、查询模板的设计与优化，以及如何在实际业务中应用这些技术。通过完整的案例演示，本文帮助开发者解决 HBase 查询中的常见问题，提高系统性能和可维护性。

1 条评论您还未登录，请先登录后发表或查看评论

KeyValue Class key和value的区别

maixia24的专栏

09-26

1811

The KeyValue Class 参考Hbase权威指南 Note 话说，KeyValue类和它的自带比较器是被设计用来内部使用的。只有在很少的地方你才能通过API访问行数据，因为外部的copy操作时被避免的。他同样运行byte级别的比较，而不是更慢的class级别的比较。在你的代码中，你可能不得不直接处理KeyValue类。因为你可能会回调，它包含和某一个坐标

Hbase 之KeyValue结构详解

南风知我意

08-30

1785

HBase 键值。这是基本的 HBase 类型。KeyValue 包装一个字节数组，并将偏移量和长度放入传递的数组中，从哪里开始将内容解释为 KeyValue。字节数组中的 KeyValue 格式为：如何把keyValue 数据取出放到Map里...

记录一次 Hbase 线上问题的分析和解决,并分析总结下背后的知识点 - KeyValue size too large...

明哥的IT随笔

12-12

2773

大家好，我是明哥！本篇文章，我们回顾一次 hbase 线上问题的分析和解决 - KeyValue size too large，总结下背后的知识点，并分享一下查看开源组件不同版本差异点的方...

mapreduce原理_Hbase Bulkload 原理面试必备

weixin_39641463的博客

11-18

317

当需要大批量的向Hbase导入数据时，我们可以使用Hbase Bulkload的方式，这种方式是先生成Hbase的底层存储文件 HFile，然后直接将这些 HFile 移动到Hbase的存储目录下。它相比调用Hbase 的 put 接口添加数据，处理效率更快并且对Hbase 运行影响更小。下面假设我们有一个 CSV 文件，是存储用户购买记录的。它一共有三列， order_id，consu...

向Hbase插入时，报错java.lang.IllegalArgumentException: KeyValue size too large的解决办法

ademocracy的博客

08-01

521

向Hbase插入时，报错java.lang.IllegalArgumentException: KeyValue size too large的解决办法使用configuration对象修改此配置使用configuration对象修改此配置 “hbase.client.keyvalue.maxsize”: “524288000” 完整配置： conf = {“hbase.zookeeper.qu...

深入浅出HBase：一文理解HBase基础概念（列存储、时间戳、key-value）、架构特点以及适合的使用场景

hiliang521的博客

01-31

4210

深入浅出HBase：一文理解HBase基础概念（列存储、）、架构特点以及适合的使用场景

HBase RowKey设计原理与代码实例讲解

AI天才研究院

07-20

954

HBase RowKey设计原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 HBase 是一个构建在分布式文件系统（如 HDFS）上的高性能、可扩展、面向列的数据库。它被设计用于处理大规模的数据集，并支持实时读取和写入。H

hbase上传大文件遇到的错误

persistence勿忘初心

07-08

8453

1.本地运行环境Java heap space （1）idea配置-Xms6024m -Xmx6024m -XX:MaxPermSize=6024m （2）windows 执行 mvn install 出现 java.lang.OutOfMemoryError: Java heap space 配置环境变量:MAVEN_OPTS =-Xms512m -Xmx1024m 然后在 path中加入%MAVEN_OPTS% （3）IDEA 打包出现...

Hbase KeyValue结构详解

bitcarmanlee的博客

01-05

9760

1综述 Hbase是面向列的存储结构，而实际存储单元里存储的都是KeyValue结构。在看Hbase的API中，发现Hbase的API中就有KeyValue类，这个KeyValue类就是Hbase中数据存储的基本类型。那么这个KeyValue里到底包含哪些内容了？为了方便理解，特意为大家来剖析一下KeyValue类的结构。 2.KeyValue类源码首先为了从大体上了解KeyValue

HBase的KeyValue分析

xiao的博客

08-12

8102

在HBase写入过程中，会检查Put中每个单元格Cell的KeyValue大小是否大于设置的maxKeyValueSize。要计算KeyValue的大小就需要了解KeyValue的的格式以及占用空间的计算方式。本文结合官方文档和源码对KeyValue的格式和空间计算进行分析和总结，便于后续继续分析HBase写入过程。

HBase的rowkey排序和scan输出顺序

weixin_33989058的博客

01-17

1229

本文目的：搞清楚HBase里面行与行之间的排序排序规则，如何正序和反序输出扫描结果。明确： HBase里面同一列的元素按照rowkey进行排序，排序规则是rowkey的ASCII码排序，小的在前大的在后。举例说明：rowkey的时间设计是Long.MAX_VALUE减去真实的timestamp（单位：秒）（System.currentTimeMillis()/1000得到），由此来看ro...

面向HBase的内存key-value缓存的实现

KDF5000的专栏

06-19

7087

0x01 背景之所以要实现这个缓存主要原因如下(但是由于不是实际业务场景需求，所以可能不太准确，也可能不存在这个需求): * 非结构化数据的爆炸式增长 * 处理速度的要求越来越高 * HBase是面向硬盘的 * 内存容量越来越大 * 热点数据可以在内存放下0x02 设计方案通常的要实现缓存，主要是在有两个大方向实现，一个是在客户端实现，另一个时在服务端实现 * 客户端实现 - 修改H

HBase源码分析之KeyValue

weixin_34346099的博客

03-30

333

HBase内部，单元格Cell的实现为KeyValue，它是HBase某行数据的某个单元格在内存中的组织形式，由Key Length、Value Length、Key、Value四大部分组成。其中，Key又由Row Length、Row、Column Family Length、Column Family、Column Qualifie...

Hbase踩过的坑（使用idea调用JavaAPI）

蓝星花

03-22

8535

一把辛酸泪啊，各种问题，网上都没有搜到一个非常完美的解决办法，几个小时候终于解决了，其实想想也挺简单的，只是没有对症下药，关键点没有找到，那下面我分享一下我的配置步骤。我的错误：前言：我们在windows上用Idea调试我们的hadoop或者hbase程序时，我们windows下面也要配置好hadoop环境，并且要注意版本一致（Maven/我们安装的版本）1.window安装hadoop环境注意：...

Hadoop运维问题

Regan_Hoo的博客

11-20

4396

① 问题描述：HBase只能启动HRegionServer，HMaster启动后瞬间又停止② 日志java.net.UnknownHostException: Invalid host name: local host is: (unknown); destination host is: "namenode":9000; java.net.UnknownHostException; ③ 解决：修改

hbase 分享笔记

幸运小侯子

06-16

1万+

hbase hbase 是什么官方说明：Use Apache HBase™ when youneed random, realtime read/write access to your Big Data. This project's goalis the hosting of very large tables -- billions of rows X millions of colu

HBase中的Memstore,HFile和KeyValue类

maizhushu的博客

05-15

1347

WAL和Memstore的意义 WAL是存储在HDFS上的，Memstore是存储在内存中的，HFile又是存储在HDFS上的。数据是先写入WAL，再被放入Memstore，最后被持久化到HFile中。数据在进入HFile之前已经被存储到HDFS一次了，为什么还需要被放入Memstore? 这是因为HDFS上的文件只能创建、追加、删除，但是不能修改。对于一个数据库来说，按顺序地存放数...

Hbase分页功能实现代码详解

HBase中，数据是按行存储的，每行数据由唯一的行键（Row Key）标识。行键通常可以设计为具有一定的排序规则，以便进行有效的数据遍历。分页查询的关键在于能够快速定位到所需数据页的起始位置，并根据查询需求来限定...