自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (10)
  • 收藏
  • 关注

原创 大数据总结

Hadoop 学习1.hvie 不是一个完整的数据库,其中最大的限制是hive不支持记录级别的更新,插入,删除。但是用户可以通过查询生成新表或者将查询结果导入到文件中PYTHON学习可以把模块想像成导入到python以增强其功能的扩展。需要使用命令import来导入块。例子:>>>import math >>>math.floor(23.6)...

2019-11-26 15:20:47 3589

转载 Apache Kylin Cube 的构建过程

来源:https://www.cnblogs.com/zlslch/p/7404465.html 不多说,直接上干货!1、 Cube的物理模型Cube物理模型如上图所示,一个常用的3维立方体,包含:时间、地点、产品。假如data cell 中存放的是产量,则我们可以根据时间、地点、产品来确定产量,同时也可以根据时间、地点来确定所有产品的总产量等。  Apache Kylin就将所有(时间...

2019-01-31 09:15:19 259

转载 大数据分析神兽麒麟

来源:https://www.cnblogs.com/huajiezh/p/6020880.html大数据分析神兽麒麟(Apache Kylin)1.Apache Kylin是什么?在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop...

2019-01-30 16:27:45 459

转载 Cloudera Manager 安装

文档来源 https://blog.youkuaiyun.com/javastart/article/details/52188663Cloudera Manager、CDH零基础入门、线路指导问题导读:1.什么是cloudera CM 、CDH?2.CDH、CM有哪些版本?3.CDH、CM有哪些安装方式?4.CDH如何开发?我们知道cloudera CDH 是为简化hadoop的安装,也对对h...

2019-01-19 11:25:46 422

转载 Hive 各版本关键新特性(Key New Feature)介绍

1、Hive 0.8.0添加 Bitmap Indexes、TIMESTAMP datatype、Plugin Developer Kit、JDBC Driver Improvements 等新特性该版本年代久远了,就不详述了~具体请参考:http://blog.cloudera.com/blog/2011/11/coming-attractions-apache-hive-0-8-0/h...

2019-01-17 09:21:29 390

转载 Hadoop cdh版本搭建

原文档:https://blog.youkuaiyun.com/liangzelei/article/details/80359461添加链接描述![在这里插入图片描述](https://blog.youkuaiyun.com/liangzelei/article/details/80359461述本文是针对LinuxCentos7服务器与CDH5.11的安装手册。1.2 关于CDH和ClouderaManag...

2019-01-16 20:56:32 297

转载 如何在CDH中安装和使用StreamSets

源文档https://cloud.tencent.com/developer/article/10788521.关于StreamSetsStreamSets由Informatica前首席产品官Girish Pancha和Cloudera前开发团队负责人Arvind Prabhakar于2014年创立。他们成立该公司主要是应对来自动态数据(data in motion)的挑战 - 包括数据源,...

2019-01-16 19:48:56 2385

附件1:冲刺-中级-201905-zlt.pdf

项目管理考试内部培训考试资料,该部分是考前冲刺题,主要是上午的笔试题。和考试的非常接近,做好这些题,项目管理考试问题不大。

2020-09-04

中级班案例分析打印版.pdf

项目管理工程师中级内部培训考试资料,和考试的非常接近,做好这些题,项目管理考试问题不大。同时确定好题目的出处。

2020-09-04

大数据学习工作总结.docx

学习大数据的笔记,涉及工作中遇到的各种场景以及解决方案等。会对初步学习大数据入门的同事会有帮助。同时还有一些pathon、操作系统基本知识

2020-09-03

数据挖掘试题

数据挖掘理论和实战常用试题,做数据分析和算法非常实用,对理解算法有帮助

2017-10-07

Teradata初次使用指南

对于初次使用Teradata进行数据库安装和服务启动帮助

2012-09-24

informatica 元数据管理平台

informatica 元数据管理平台,详细描述了informaitcia内部的superglue进行元数据管理的内容

2008-11-14

informatica教程

很好的书,对学习etl工具的人很有用处。希望你们好好收藏,共同进步

2008-11-04

essbase操作指南

操作指南essbase

2008-07-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除