大数据之Hive<五>

 DML数据操作

5.1 数据导入

5.1.1 向表中装载数据(Load

1)语法

hive>load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student [partition (partcol1=val1,…)];

1load data:表示加载数据

2local:表示从本地加载数据到hive表;否则从HDFS加载数据到hive

3inpath:表示加载数据的路径

4overwrite:表示覆盖表中已有数据,否则表示追加

5into table:表示加载到哪张表

6student:表示具体的表

7partition:表示上传到指定分区

2)实操案例

       0)创建一张表

hive (default)> create table student(id string, name string) row format delimited fields terminated by '\t';

1)加载本地文件到hive

hive (default)> load data local inpath '/opt/module/datas/student.txt' into table default.student;

       2)加载HDFS文件到hive

       上传文件到HDFS

hive (default)> dfs -put /opt/module/datas/student.txt /user/jduser/hive;

加载HDFS上数据

hive (default)>load data inpath '/user/jduser/hive/student.txt' into table default.student;

       3)加载数据覆盖表中已有的数据

       上传文件到HDFS

hive (default)> dfs -put /opt/module/datas/student.txt /user/jduser/hive;

加载数据覆盖表中已有的数据

hive (default)>load data inpath '/user/jduser/hive/student.txt' overwrite into table default.student;

5.1.2 通过查询语句向表中插入数据(Insert

1)创建一张分区表

hive (default)> create table student(id int, name string) partitioned by (month string)row format delimited fields terminated by '\t';

2)基本插入数据

hive (default)> insert into table  student partition(month='201709') values(1,'wangwu');

3)基本模式插入(根据单张表查询结果)

hive (default)> insert overwrite table student partition(month='201708')

             select id, name from student where month='201709';

4)多插入模式(根据多张表查询结果)

hive (default)> from student

              insert overwrite table student partition(month='201707')

              select id, name where month='201709'

              insert overwrite table student partition(month='201706')

              select id, name where month='201709';

5.1.3 查询语句中创建表并加载数据(As Select

详见4.5.1章创建表。

根据查询结果创建表(查询的结果会添加到新创建的表中)

create table if not exists student3

as select id, name from student;

5.1.4 创建表时通过Location指定加载数据路径

1)创建表,并指定在hdfs上的位置

hive (default)> create table if not exists student5(

              id int, name string

              )

              row format delimited fields terminated by '\t'

              location '/user/hive/warehouse/student5';

2)上传数据到hdfs

hive (default)> dfs -put /opt/module/datas/student.txt  /user/hive/warehouse/student5;

3)查询数据

hive (default)> select * from student5;

5.1.5 Import数据到指定Hive表中

注意:先用export导出后,再将数据导入。

hive (default)> import table student2 partition(month='201709') from'/user/hive/warehouse/export/student';

5.2 数据导出

5.2.1 Insert导出

1)将查询的结果导出到本地

hive (default)> insert overwrite local directory '/opt/module/datas/export/student'

            select * from student;

2)将查询的结果格式化导出到本地

hive (default)> insert overwrite local directory'/opt/module/datas/export/student1'

             ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'             select * from student;

3)将查询的结果导出到HDFS(没有local)

hive (default)> insert overwrite directory '/user/jduser/student2'

             ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'

             select * from student;

5.2.2 Hadoop命令导出到本地

hive (default)> dfs -get /user/hive/warehouse/student/month=201709/000000_0  /opt/module/datas/export/student3.txt;

5.2.3 Hive Shell 命令导出

基本语法:(hive -f/-e 执行语句或者脚本 > file

[jduser@hadoop102 hive]$ bin/hive -e 'select * from default.student;' > /opt/module/datas/export/student4.txt;

5.2.4 Export导出到HDFS

hive (default)> export table default.student to'/user/hive/warehouse/export/student';

5.2.5 Sqoop导出


5.3 清除表中数据(Truncate

注意:Truncate只能删除管理表,不能删除外部表中数据

hive (default)> truncate table student;
1. 用户与身体信息管理模块 用户信息管理: 注册登录:支持手机号 / 邮箱注册,密码加密存储,提供第三方快捷登录(模拟) 个人资料:记录基本信息(姓名、年龄、性别、身高、体重、职业) 健康目标:用户设置目标(如 “减重 5kg”“增肌”“维持健康”)及期望周期 身体状态跟踪: 体重记录:定期录入体重数据,生成体重变化曲线(折线图) 身体指标:记录 BMI(自动计算)、体脂率(可选)、基础代谢率(根据身高体重估算) 健康状况:用户可填写特殊情况(如糖尿病、过敏食物、素食偏好),系统据此调整推荐 2. 膳食记录与食物数据库模块 食物数据库: 基础信息:包含常见食物(如米饭、鸡蛋、牛肉)的名称、类别(主食 / 肉类 / 蔬菜等)、每份重量 营养成分:记录每 100g 食物的热量(kcal)、蛋白质、脂肪、碳水化合物、维生素、矿物质含量 数据库维护:管理员可添加新食物、更新营养数据,支持按名称 / 类别检索 膳食记录功能: 快速记录:用户选择食物、输入食用量(克 / 份),系统自动计算摄入的营养成分 餐次分类:按早餐 / 午餐 / 晚餐 / 加餐分类记录,支持上传餐食照片(可选) 批量操作:提供常见套餐模板(如 “三明治 + 牛奶”),一键添加到记录 历史记录:按日期查看过往膳食记录,支持编辑 / 删除错误记录 3. 营养分析模块 每日营养摄入分析: 核心指标计算:统计当日摄入的总热量、蛋白质 / 脂肪 / 碳水化合物占比(按每日推荐量对比) 微量营养素分析:检查维生素(如维生素 C、钙、铁)的摄入是否达标 平衡评估:生成 “营养平衡度” 评分(0-100 分),指出摄入过剩或不足的营养素 趋势分析: 周 / 月营养趋势:用折线图展示近 7 天 / 30 天的热量、三大营养素摄入变化 对比分析:将实际摄入与推荐量对比(如 “蛋白质摄入仅达到推荐量的 70%”) 目标达成率:针对健
1. 用户管理模块 用户注册与认证: 注册:用户填写身份信息(姓名、身份证号、手机号)、设置登录密码(需符合复杂度要求),系统生成唯一客户号 登录:支持账号(客户号 / 手机号)+ 密码登录,提供验证码登录、忘记密码(通过手机验证码重置)功能 身份验证:注册后需完成实名认证(模拟上传身份证照片,系统标记认证状态) 个人信息管理: 基本信息:查看 / 修改联系地址、紧急联系人、邮箱等非核心信息(身份证号等关键信息不可修改) 安全设置:修改登录密码、设置交易密码(用于转账等敏感操作)、开启 / 关闭登录提醒 权限控制:普通用户仅能操作本人账户;管理员可管理用户信息、查看系统统计数据 2. 账户与资金管理模块 账户管理: 账户创建:用户可开通储蓄卡账户(默认 1 个主账户,支持最多 3 个子账户,如 “日常消费账户”“储蓄账户”) 账户查询:查看各账户余额、开户日期、状态(正常 / 冻结)、交易限额 账户操作:挂失 / 解挂账户、申请注销账户(需余额为 0) 资金操作: 转账汇款:支持同行转账(输入对方账户号 / 手机号),需验证交易密码,可添加常用收款人 存款 / 取款:模拟存款(输入金额增加余额)、取款(输入金额减少余额,需不超过可用余额) 交易记录:按时间、类型(转入 / 转出 / 存款 / 取款)查询明细,显示交易时间、金额、对方账户(脱敏显示)、交易状态 3. 账单与支付模块 账单管理: 月度账单:自动生成每月收支明细,统计总收入、总支出、余额变动 账单查询:按月份、交易类型筛选账单,支持导出为 Excel 格式 还款提醒:若有贷款(简化版可模拟),系统在还款日 3 天前发送提醒 快捷支付: 绑定支付方式:添加银行卡(系统内账户)作为支付渠道 模拟消费:支持输入商户名称和金额,完成支付(从账户余额扣减) 支付记录:保存所有消费记录,包含商户、时间、金额、支付状态 4.
### 关于尚硅谷大数据Hive实战教程第11章的内容 在尚硅谷的大数据技术系列教程中,针对Hive的实战部分提供了详尽的学习材料[^3]。具体到第十一章节,主要聚焦于通过实际操作来加深理解,使学员能够掌握如何利用Hive处理大规模结构化数据集。 #### 主要内容概览 - **复杂查询优化** - 学习者会了解到不同类型的查询语句及其执行计划,并学会运用多种策略提升查询效率。 - **UDF函数开发** - 讲解自定义用户定义函数(UDF),允许使用者编写自己的逻辑并将其嵌入至SQL查询之中,从而扩展Hive的功能边界。 - **分区与分桶管理** - 探讨高效的数据组织方式——即分区(partitioning)和分桶(bucketing),以及它们对于加速特定模式下读取速度的重要性。 - **性能调优技巧** - 提供一系列实践建议帮助调整参数设置以达到最佳运行状态;包括但不限于内存分配、并发控制等方面的知识点。 ```sql -- 示例:创建外部表时指定文件格式为ORC,并采用LATERAL VIEW展开JSON数组字段 CREATE EXTERNAL TABLE IF NOT EXISTS my_table ( id STRING, data ARRAY<STRUCT<key:STRING,value:INT>> ) ROW FORMAT SERDE 'org.apache.hive.serde2.lazy.LazySimpleSerDe' STORED AS ORC LOCATION '/path/to/data'; SELECT t.id, tc.category_name FROM my_table LATERAL VIEW EXPLODE(data) t_data AS key, value; ``` 此章节不仅限理论讲解,更强调动手能力培养,鼓励读者跟随指导完成相应练习项目,在真实环境中验证所学概念的有效性和实用性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值