
hadoop
文章平均质量分 71
「已注销」
这个作者很懒,什么都没留下…
展开
-
Hive面试题
1、hive内部表和外部表的区别未被external修饰的是内部表,被external修饰的为外部表。区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse), 外部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上 的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据转载 2021-05-26 09:19:06 · 186 阅读 · 0 评论 -
Hive | 4万字性能调优面试总结2
HiveSQL语法原理hive的DDL语法对数据库的操作 创建数据库: create database if not exists myhive; 说明:hive的表存放位置模式是由hive-site.xml当中的一个属性指定 的 :hive.metastore.warehouse.dir 创建数据库并指定hdfs存储位置 : create database myhive2 location '/myhive2'; 修改数据库: alter database myh转载 2021-05-26 09:17:44 · 324 阅读 · 0 评论 -
Hive | 4万字性能调优面试总结
本文基本涵盖以下内容: 一、基于Hadoop的数据仓库Hive基础知识 二、HiveSQL语法 三、Hive性能优化 四、Hive性能优化之数据倾斜专题 五、HiveSQL优化十二板斧 六、Hive面试题(一) 七、Hive/Hadoop高频面试点集合(二) 基于Hadoop的数据仓库Hive基础知识Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的转载 2021-05-26 09:12:03 · 423 阅读 · 0 评论 -
HBase - Filter - 过滤器的介绍以及使用
1 过滤器HBase 的基本 API,包括增、删、改、查等。增、删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan)。HBase 不仅提供了这些简单的查询,而且提供了更加高级的过滤器(Filter)来查询。1.1 过滤器的两类参数过滤器可以根据列族、列、版本等更多的条件来对数据进行过滤,基于 ...转载 2019-03-05 14:25:20 · 999 阅读 · 0 评论 -
Hbase中内置Filter详解
一、建表1、表名:“ORDER_TABLE”2、列簇:“user”,“order”,“item”3、表结构如下:二、封装服务服务代码如下:@Override public String get(String tableName, Filter filter) { Scan scan = new Scan(); scan.setF...转载 2019-03-05 14:07:18 · 331 阅读 · 0 评论 -
hbase解决海量图片存储
随着互联网、云计算及大数据等信息技术的发展,越来越多的应用依赖于对海量数据的存储和处理,如智能监控、电子商务、地理信息等,这些应用都需要对海量图片的存储和检索。由于图片大多是小文件(80%大小在数MB以内),以GFS、HDFS为代表的适用于流式访问大文件的分布式存储系统,若直接用来存储图片,由于元数据膨胀,在扩展性和性能方面均存在严重问题。 为了解决HDFS在小文件存储方面的问题,通常的...转载 2019-02-28 10:51:26 · 1531 阅读 · 0 评论 -
HBase shell scan 模糊查询
0.进入hbase shell./hbase shell help help “get” #查看单独的某个命令的帮助1. 一般命令status 查看状态version 查看版本2.DDL(数据定义语言Data Definition Language)命令1. 创建表create ‘表名称’,’列名称1’,’列名称2’,’列名称3’ 如:create 'member','m...转载 2019-01-07 15:40:48 · 1279 阅读 · 0 评论 -
sqoop导入hive表报错Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set co
sqoop导入hive表报错Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set correctly 方法1:往~/.bash_profile里新加一行export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*然后,...原创 2018-12-25 16:55:16 · 517 阅读 · 0 评论 -
java链接hbase报错 org.apache.hadoop.hbase.MasterNotRunningException: com.google.protobuf.ServiceExceptio
我的环境是:Hadoop、Hbase、Hive安装在虚拟机Centos上,一个Master,五个backup,Ip地址为:192.168.178.30 master1192.168.178.31 master2192.168.178.32 slave1192.168.178.33 slave2192.168.178.34 slave3192.168.17...原创 2019-01-04 16:21:20 · 1615 阅读 · 0 评论