
JAVA
Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。
司小幽
知行合一,学而思。
展开
-
《大数据工程师(开发)面试系列(2)》
1.HBase和Hive都是基于Hadoop,为什么Hive查询起来非常慢,但HBase不是?Hive是类SQL引擎,其查询都需要遍历整张表,跑MapReduce自然很慢,但HBase是一种NoSQL的列式数据库,基于Key/Value的存储格式,不需要像Hive一样遍历,自然在速度上,乃至写的性能上是相当之快的。相关参考文献:HIVE和HBASE区别2.通原创 2016-11-14 10:31:09 · 2206 阅读 · 0 评论 -
通过Hive及其Udf函数进行Nginx日志分析
需求nginx日志格式: '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"'; (暂且不将remoteaddr与remote_addr与remote_u原创 2017-08-10 13:09:23 · 683 阅读 · 0 评论 -
Java-随机范围内分割大文件
需求有一份文件,不大,通常电脑可以一次性读取。文件格式为若干行手机号码。将这个文件以随机范围[37~40]进行分割,也就是说当读取的行数满足随机范围的,则分割生成一个包含该行数小文件,剩余不足37行的,独自生成一个文件。 文件每行的内容,由原来”手机号”,更改为”手机号,text”格式。语言Java实现思路生成[37~40]的随机数 通过commons.io进行读取原文件 通过StringBu原创 2017-08-12 10:53:46 · 539 阅读 · 0 评论 -
大数据工程师(开发)面试系列(5)
1. Java的第三方模块你用过哪些?我:也没有刻意去记,所以也没说出来。 补:技术干货:十个非常有用的第三方Java开源库 细数一下,上述所列十个里,大致用过1/2。2. Python的第三方模块你用过哪些?我:爬虫所用urllib,urllib2 补:模块和包.那些让你相见恨晚的PYTHON第三方好用的模块儿和包?3. 你用你的程序调度Kylin以及承接数据失败怎么办?我:在调度之前有落原创 2017-03-19 17:26:06 · 1554 阅读 · 0 评论