
Hive
大数据YYDS
致力于成为最强架构师的男人!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
# HIVE udf和udtf功能使用
HIVE udf和udtf功能使用 前言:之前在实习过程中,有一个业务需求,因为开始没有理解需求,所以走了很多弯路,最后修改代码逻辑的时候发现还有上游字段没有解析,需要些一个udtf来完成需求。之前虽然了解过udf和udtf等,但是没有实际写过,最后差点任务延期,所以在使用hive过程中,udf和udtf也应该作为数据开发人员的基本功,在实际开发过程中也是经常需要使用的。1、UDF:用户定义(普通)函数,只对单行数值产生作用;继承UDF类,添加方法evaluate();注意:evaluate()方原创 2021-10-31 18:00:54 · 1075 阅读 · 0 评论 -
Hive数据倾斜问题、优化问题、架构问题总结
Hive以下复习内容包括架构、与MySql数据库的比较、四种By、小数据问题、两种常见数据倾斜问题和讲解、Hive的简单优化;Hive的架构Hive都是用别人来存东西,自己一点都不存,只负责翻译HQL成MR程序;//客户端Client: CLI(command-line interface)、JDBC/ODBC(jdbc访问hive)、WEBUI(浏览器访问hive)//Sql Parser和Physical Plan 把HQL语句翻译成对应的MR任务//元数据Meta Store原创 2021-07-24 23:17:30 · 628 阅读 · 1 评论