大数据
文章平均质量分 50
人在梦外之梦--programmer
大数据开发者
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Davinci 连接mongodb数据源
Davinci 连接mongodb数据源资料很少,找到一篇相对不错的文章,内有有多种方式:参考链接:本文采用mongo-bi连接器 mongo官方没有提供mongo的JDBC驱动,但是提供了mongo-bi-connector,允许使用所选的BI工具通过标准SQL查询对MongoDB数据进行可视化。BI Connector 可以使用 SQL 或 ODBC 数据源方式直接访问 MongoDB,MongoDB 早期版本直接使用 Postgresql FDW 来实现 SQL 到 MQL 的转换,后来实原创 2021-03-18 16:52:27 · 704 阅读 · 0 评论 -
flume-1.5.2 安装和测试
flume-1.5.2 安装和测试#解压到当前目录 tar -xf apache-flume-1.5.2-bin.tar.gz 修改目录名称mv apache-flume-1.5.2-bin flume切换到目录cd flume/conf/新建一个配置文件vi flume.conf加入下列配置# 指定Agent的组件名称a1.sources = r1a1.sinks = k1a1.channels = c1# 指定Flume source(要监听的路径)a1.sourc原创 2021-03-11 15:48:00 · 521 阅读 · 0 评论 -
sqoop 1.4.7 安装全过程
sqoop 1.4.7 安装全过程原创 2021-03-10 17:35:58 · 733 阅读 · 0 评论 -
hbase 1.4.10 HA高可用集群安装(全)
hbase 1.4.10 HA高可用集群安装(全)上传压缩包并解压tar -xf hbase-1.4.10-bin.tar.gz修改文件夹名称 mv hbase-1.4.10 hbase cd hbase修改配置文件1cd conf/vi hbase-env.sh禁用内部zk修改配置文件2 vi hbase-site.xml<configuration> <property> <name&原创 2021-03-09 18:17:39 · 358 阅读 · 0 评论 -
kafka 2.11 安装和测试(Linux环境)
单机版kafka的安装原创 2021-03-08 16:08:24 · 343 阅读 · 0 评论 -
redis 3.2.4 安装(亲测有效!)
redis 3.2.4 安装(亲测有效!) 2021-03一、redis安装1 下载redis下载链接:https://download.redis.io/releases/选择你需要的版本2 下载并解压wget http://download.redis.io/releases/redis-3.2.4.tar.gztar -xf redis-3.2.4.tar.gz3 编译cd redis-3.2.4make make insta原创 2021-03-08 13:08:34 · 537 阅读 · 0 评论 -
hive3.1.0 安装和连接
hive3.1.0 安装和连接前言:安装hive之前一定确保MySQL已安装启动和hdfs启动ps -ef|grep mysqljps1 下载cd /opt/apps/serverswget http://archive.apache.org/dist/hive/hive-3.1.0/apache-hive-3.1.0-bin.tar.gz2 解压tar -xf apache-hive-3.1.0-bin.tar.gz3 修改名称 mv apache-hive-3.1.原创 2021-03-05 12:11:34 · 929 阅读 · 1 评论 -
HDFS 命令大全
概要用户命令dfs 命令追加文件内容查看文件内容得到文件的校验信息修改用户组修改文件权限修改文件所属用户本地拷贝到 hdfshdfs 拷贝到本地获取目录,文件数量及大小hdfs 内拷贝createSnapshot 创建快照deleteSnapshot 删除快照显示空闲空间显示文件和目录大小清空回收站查找文件显示目录或文件的访问控制列表显示文件或目录的扩展信息...原创 2019-12-27 18:34:32 · 556 阅读 · 0 评论 -
zookeeper
如果有人问你ZooKeeper是什么,就把这篇文章发给他。 提到ZooKeeper,相信大家都不会陌生。Dubbo,Kafka,Hadoop等等项目里都能看到它的影子。但是你真的了解 ZooKeeper 吗?如果面试官让你给他讲讲 ZooKeeper 是个什么东西,你...转载 2019-10-10 15:58:58 · 145 阅读 · 0 评论 -
你必备的39个大数据可视化工具
你必备的39个大数据可视化工具 数据可视化无处不在,而且比以前任何时候都重要,无论是在行政演示中为数据点创建一个可视化进程,还是用可视化概念来细分客户,数据可视化都显得尤为重要,本文将推荐39个可用于处理大数据的可视化工具(排名不分先后)。 作者:Andy Lurie 翻...转载 2019-01-26 08:44:38 · 1691 阅读 · 0 评论 -
数据仓库基本概念
数据仓库基本概念 一、度量、指标、指标器度量和维度构成OLAP的主要概念,对于在事实表或者一个多维立方体里面存放的数值型的、连续的字段,就是度量。这符合上面的意思,有标准,一个度量字段肯定是统一单位,例如元、户数。如果一个度量字段,其中的度量值可能是欧元又有可能是美元,那这个度量没法汇总。在OLAP中还有计算度量的说法,用一个总费用除以用户数,得到每户平均...转载 2019-03-10 19:37:47 · 790 阅读 · 0 评论 -
OLAP、OLTP的介绍和比较
OLAP、OLTP的介绍和比较OLTP与OLAP的介绍数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决...转载 2019-03-26 20:01:09 · 161 阅读 · 0 评论 -
hive分析窗口函数 NTILE,ROW_NUMBER,RANK,DENSE_RANK
本文中介绍前几个序列函数,NTILE,ROW_NUMBER,RANK,DENSE_RANK,下面会一一解释各自的用途。Hive版本为 apache-hive-0.13.1注意: 序列函数不支持WINDOW子句。(什么是WINDOW子句)数据准备:cookie1,2015-04-10,1cookie1,2015-04-11,5cookie1,2015-04-12,7cookie1,2...转载 2019-03-27 10:31:57 · 166 阅读 · 0 评论 -
HDFS常用命令
HDFS常用命令 在 hdfs 文件系统上创建一个 input 文件夹 bin/hdfs dfs -mkdir -p /user/anna/input将测试文件内容上传到文件系统上 bin/hdfs dfs -put wc.input /user/anna/input查看上传的文件是否正确 bin/hdfs dfs -cat /user/anna/inpu...转载 2019-04-25 15:49:23 · 280 阅读 · 0 评论 -
安装Hue后的一些功能的问题解决干货总结(博主推荐)
不多说,直接上干货! 我的集群机器情况是 bigdatamaster(192.168.80.10)、bigdataslave1(192.168.80.11)和bigdataslave2(192.168.80.12) 然后,安装目录是在/home/hadoop/app下。 官方建议在master机器上安装Hue,我这里也不例外。...转载 2018-12-26 18:46:59 · 4221 阅读 · 3 评论
分享