hue4.0的安装和配置

本文详细介绍了如何在生产环境中安装配置Hue 4.0,包括MySQL设置、Hadoop相关配置、Hue的配置以及Hive环境变量配置等步骤。重点讲解了使用MySQL替代sqlite作为元数据库的流程,如创建数据库、初始化数据以及启动Hue的顺序。
依赖安装:
 
sudo yum install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi cyrus-sasl-plain gcc gcc-c++ krb5-devel libffi-devel libxml2-devel libxslt-devel make mysql mysql-devel openldap-devel python-devel sqlite-devel  gmp-devel openssl-devel  

二、MySQL配置

1、    为root用户设置密码;
2、    配置远程登录
3、    创建hue数据库
4、    flush hosts
5、    flush privileges

三、解压、编译并安装

tar -zxvf hue-3.12.0.tgz -C /opt
cd /opt/ hue-3.12.0
make apps

四、集成环境配置

1、配置HDFS

vim /opt/hadoop-2.7.3/etc/hadoop/hdfs-site.xml

复制代码
<property>
     <name>dfs.webhdfs.enabled</name>
     <value>true</value>
</property>

<property>
     <name>dfs.permissions.enabled</name>
     <value>false</value>
</property>
复制代码

2、配置core-site.xml

vim /opt/hadoop-2.7.3/etc/hadoop/core-site.xml

复制代码
<property>
     <name>hadoop.proxyuser.hue.hosts</name>
      <value>*</value>
</property>

<property>
      <name>hadoop.proxyuser.hue.groups</name>
      <value>*</value>
</property>

<property>
       <name>hadoop.proxyuser.root.hosts</name>
       <value>*</value>
 </property>

  <property>
       <name>hadoop.proxyuser.root.groups</name>
        <value>*</value>
 </property>
<think> 我们正在讨论的是在Hue(一个开源的Hadoop用户界面)中如何查询表的大小。 在Hadoop生态中,表的大小通常存储在Hive的元数据中,但是直接查询元数据可能需要特定的权限。在Hue中,用户通常通过Hive查询界面来执行SQL查询,而表的大小信息可以通过Hive的元数据表或者使用Hive的统计信息来获取。 有两种常见的方法: 1. 使用`DESCRIBE FORMATTED`命令:这个命令可以显示表的详细信息,包括表的大小(totalSize)行数(numRows)等,但前提是这些统计信息已经被收集过(通过ANALYZE TABLE命令收集)。 2. 直接查询Hive的元数据表(如`TBLS``SDS`等),但这通常需要管理员权限,并且不同版本的Hive元数据表结构可能不同,因此不推荐在Hue中直接查询元数据表,除非有必要的权限了解元数据表结构。 在Hue中,用户通常使用第一种方法。因此,我们可以指导用户通过执行HiveQL语句来获取表的大小。 步骤如下: - 打开Hue的Hive查询界面。 - 输入以下命令(将`[database_name.]table_name`替换为实际的数据库名表名): ```sql DESCRIBE FORMATTED [database_name.]table_name; ``` - 执行查询后,在结果中查找`totalSize``rawDataSize`(单位是字节)以及`numRows`(行数)等信息。 注意:如果表的大小没有显示,可能是因为没有收集统计信息。可以使用以下命令收集: ```sql ANALYZE TABLE [database_name.]table_name COMPUTE STATISTICS; ``` 对于分区表,则使用: ```sql ANALYZE TABLE [database_name.]table_name COMPUTE STATISTICS FOR COLUMNS; ``` 或者(对于分区): ```sql ANALYZE TABLE [database_name.]table_name PARTITION(partition_column) COMPUTE STATISTICS; ``` 另外,Hue的元数据浏览器可能也提供了表大小的查看功能,但具体取决于Hue的版本配置。用户可以在Hue的左侧导航栏中找到“Metastore Tables”或类似的选项,然后浏览到相应的表,查看其详细信息,其中可能包含表的大小。 但是,根据Hue的常见界面,最可靠的方式还是通过执行HiveQL查询。 因此,总结在Hue中查询表大小的方法: 1. 使用Hive查询执行`DESCRIBE FORMATTED`语句。 2. 如果统计信息不存在,先运行`ANALYZE TABLE`收集统计信息。 3.Hue的元数据浏览器中查看(如果支持)。 注意:收集统计信息可能需要一定时间,特别是对于大表。 引用说明:这些方法基于Hive的常见使用方式[^1]。 下面,我们将生成相关问题。 </think> 在Hue中查询表大小主要通过以下两种方法实现,具体操作步骤如下: ### 📊 方法一:使用元数据浏览器 1. 登录Hue后,在左侧导航栏点击 **"Tables"**(或**"Metastore Tables"**) 2. 在数据库列表中选择目标数据库(如:`default`) 3. 找到目标数据表,**悬停鼠标**在表名上 4. 点击出现的 **"i"(信息图标)** 或 **"预览"** 按钮 5. 在表详情页面查看 **"Size"** 字段值(自动转换为易读单位如MB/GB) ```sql -- 示例显示格式: Size: 2.4 GB (2,576,980,377 bytes) ``` ### ⚙️ 方法二:执行HiveQL查询 1. 打开Hue的 **Query Editor**(查询编辑器) 2. 选择执行引擎为 **Hive** 3. 输入以下命令(替换`your_table_name`): ```sql DESCRIBE FORMATTED your_table_name; ``` 4. 在查询结果中定位以下字段: - `totalSize`:表数据总大小(字节) - `rawDataSize`:原始数据大小(字节) - `numRows`:总行数 ```shell # 典型结果示例: | totalSize | 2576980377 | | rawDataSize | 2147483648 | | numRows | 3845921 | ``` ### ⚠️ 注意事项 1. 如果查询不到大小信息,需先收集统计信息: ```sql ANALYZE TABLE your_table_name COMPUTE STATISTICS; -- 分区表需指定分区 ANALYZE TABLE partitioned_table PARTITION(dt='2023-10-01') COMPUTE STATISTICS; ``` 2. 查看HDFS底层文件大小(需HDFS访问权限): ```sql hdfs dfs -du -h /user/hive/warehouse/your_db.db/your_table ``` > 💡 **提示**:在Hue 4.0+版本中,表大小信息会直接在表列表页面显示,无需点击详情[^1]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值