- 博客(4)
- 收藏
- 关注
原创 自定义函数步骤:
在编辑工具中写好java代码继承UDF函数重载里面的evaluate方法,上传到linux,打成jar包(找到文件重命名),在hive中执行【add jar “路径”;命令】(添加到hive的环境变量), 执行create temporary function 临时函数名 as 类全名,然后执行命令select 临时函数名(字段) from 表 ...
2020-10-19 20:59:59
301
原创 20道大数据常见面试题
1.Hadoop分布式集群与伪分布式集群的区别 分布式集群需要多台电脑,,一台为奴隶主机,其他的为奴隶机用来存储数据。 伪分布式集群可以使用一台电脑搭建,也可以使用多台电脑,只需要在slaves中添加自己的主机名就可以了,其他的与分布式一样。 2.Hadoop分为三个核心部分,每个部分是什么,有什么功能? 三个核心:hdfs,mapreduce和yarn Hadfs:分布式文件系统,mapreduce:分布式计算框架,yarn:资源调度器 功能:hdfs:由很多服务器联合起来实现其功能,集群中的
2020-10-19 20:56:59
1500
2
原创 hadoop相关面试题
MapTask并行机度是由什么决定的? 由切片数量决定的。 MR是干什么的? MR将用户编写的业务逻辑代码和自带的默认组件结合起来组成一个完整的分布式应用程序放到hadoop集群上运行。 MR的实例进程: driver(mr的job提交客户端) MRAppMaster MapTask ReduceTask combiner和partition的作用: combiner的意义就是对每一个maptask的输出进行局部汇总,以减小网络传输量 partition的默认实现是hashpartition,是map端将数
2020-10-19 20:54:44
298
1
原创 Java的几种设计模式
Java的几种设计模式 java的设计模式大体上分为三大类: 创建型模式(5种):工厂方法模式,抽象工厂模式,单例模式,建造者模式,原型模式。 结构型模式(7种):适配器模式,装饰器模式,代理模式,外观模式,桥接模式,组合模式,享元模式。 行为型模式(11种):策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。 设计模式...
2019-11-12 10:33:45
321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅