20180604早课记录24-Hive

本文详细介绍了 Hive 数据库的基本概念,包括数据存储方式、建表 SQL 语句的构成、默认分隔符等内容,并深入探讨了分区表的概念、静态与动态分区的区别以及如何使用 Hive 进行数据操作。
1. hive数据分为哪两块?分别存储在哪?

元数据和数据本身; mysql等关系型数据库 和 hdfs

2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)

定义分区,分隔字符,内外表之分

3. 默认的换行符和分割符是什么?

/t /r

4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?

LOAD DATA LOCAL INPATH 'xxx' OVERWRITE INTO TABLE xxxx;

5.hive的执行引擎是mr,请问哪种hive SQL是触发mr job的

带聚合函数,某些insert,还有create table as select

6. create table a as select * from b; 你们觉得有没有mr job?

7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询

定义:CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加载数据:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month='2017-12');
查询:select * from test1.order_created_partition
where event_month='2017-12';

8. 静态分区表和动态分区表是什么区别?

静态只能自己手动建立分区表 动态可以设置分区字段然后自动分区

9. 查看函数的是什么语法?

desc function xxx

10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?

支持

转载于:https://blog.51cto.com/10814168/2125944

内容概要:本文介绍了基于贝叶斯优化的CNN-LSTM混合神经网络在时间序列预测中的应用,并提供了完整的Matlab代码实现。该模型结合了卷积神经网络(CNN)在特征提取方面的优势与长短期记忆网络(LSTM)在处理时序依赖问题上的强大能力,形成一种高效的混合预测架构。通过贝叶斯优化算法自动调参,提升了模型的预测精度与泛化能力,适用于风电、光伏、负荷、交通流等多种复杂非线性系统的预测任务。文中还展示了模型训练流程、参数优化机制及实际预测效果分析,突出其在科研与工程应用中的实用性。; 适合人群:具备一定机器学习基基于贝叶斯优化CNN-LSTM混合神经网络预测(Matlab代码实现)础和Matlab编程经验的高校研究生、科研人员及从事预测建模的工程技术人员,尤其适合关注深度学习与智能优化算法结合应用的研究者。; 使用场景及目标:①解决各类时间序列预测问题,如能源出力预测、电力负荷预测、环境数据预测等;②学习如何将CNN-LSTM模型与贝叶斯优化相结合,提升模型性能;③掌握Matlab环境下深度学习模型搭建与超参数自动优化的技术路线。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点关注贝叶斯优化模块与混合神经网络结构的设计逻辑,通过调整数据集和参数加深对模型工作机制的理解,同时可将其框架迁移至其他预测场景中验证效果。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值