
大数据hadoop
老钱的人工智能探索
楚门智能创始人,昆士兰理工大学数据科学硕士,多年大数据行业经验,原联想电商大数据平台负责人,Cloudera认证架构师、管理员,主要科研方向为数据科学,在自然语言处理领域有资深的经验,擅长Spark、Hadoop等平台架构,具有多年的实战经验。
展开
-
Hadoop 2.1.0 beta HDFS SnapShot 介绍
Hadoop 2.1.0 Beta 版 HDFS 提供了SnapShot 模块。用于数据备份、回滚。已防止因用户的失误操作导致集群出现问题。本文先做一个简单的介绍,其他的文章在来介绍Snapshot 本身的实现机制。 首先 HDFS 的Snapshot 大概有以下几个特性: Snapshot 创建的时间 复杂度为O(1),但是不包括INo...2013-08-27 22:22:00 · 151 阅读 · 0 评论 -
Apache Hive 0.11 版本分析
目前Hive 0.11 版本已经发本,本文旨在分析0.11的新特性。 Bug 修复:(我个人遇到很多) Hive 0.11版修复了hive本身存在的数10处bug,重点包括: [HIVE-2264] - Hive server is SHUTTING DOWN when invalid ...2013-09-03 11:24:17 · 148 阅读 · 0 评论 -
Hive 即将支持存储过程
最近在承接一个项目,碰到了PL/SQL的需求,于是查看了一下相关的文档。在hive的主分支上,发送hplsql module, Jira相关位置https://issues.apache.org/jira/browse/HIVE-11055 2.0.0 出现,大家尽请期待!!! 更多精彩请关注微信 : 图灵搜索请大家使用中国第一个为程序员打造的搜索引擎...2015-10-09 17:55:09 · 579 阅读 · 0 评论