Kylin 快速入门 (一)数据准备

本文介绍如何在Hive中创建外部表并导入数据,包括部门和员工表的建立,为后续的数据分析项目奠定基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求:实现按照维度(工作地点)统计员工信息

数据准备

在 Hive 中创建数据,分别创建部门和员工外部表,并向表中导入数据。
(1)创建数据库

create database kylin_test;

use kylin_test;

(2)建表语句

create external table if not exists dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by '\t';

创建员工表

create external table if not exists emp(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by '\t';

(3)数据准备

部门表(dept.txt)

10	ACCOUNTING	1700
20	RESEARCH	1800
30	SALES	1900
40	OPERATIONS	1700

员工表(emp.txt)

7369	SMITH	CLERK	7902	1980-12-17	800.00		20
7499	ALLEN	SALESMAN	7698	1981-2-20	1600.00	300.00	30
7521	WARD	SALESMAN	7698	1981-2-22	1250.00	500.00	30
7566	JONES	MANAGER	7839	1981-4-2	2975.00		20
7654	MARTIN	SALESMAN	7698	1981-9-28	1250.00	1400.00	30
7698	BLAKE	MANAGER	7839	1981-5-1	2850.00		30
7782	CLARK	MANAGER	7839	1981-6-9	2450.00		10
7788	SCOTT	ANALYST	7566	1987-4-19	3000.00		20
7839	KING	PRESIDENT		1981-11-17	5000.00		10
7844	TURNER	SALESMAN	7698	1981-9-8	1500.00	0.00	30
7876	ADAMS	CLERK	7788	1987-5-23	1100.00		20
7900	JAMES	CLERK	7698	1981-12-3	950.00		30
7902	FORD	ANALYST	7566	1981-12-3	3000.00		20
7934	MILLER	CLERK	7782	1982-1-23	1300.00		10

(4)向外部表中导入数据
导入数据

hive (default)> load data local inpath '/opt/module/data/dept.txt' 
into table dept;
hive (default)> load data local inpath '/opt/module/data/emp.txt' into table emp;

查询结果

hive (kylin_test)> select * from emp;
hive (kylin_test)> select * from dept;

创建项目

登录系统

在这里插入图片描述

创建工程

1)点击图上所示“+”号

在这里插入图片描述2)填入项目名及描述点击 Submit

在这里插入图片描述

选择数据源

1)选择加载数据源方式

在这里插入图片描述
2)同步要作为数据源的表

在这里插入图片描述
3)此时成功

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值