- 博客(34)
- 收藏
- 关注
转载 Power BI vs. QuickBI vs. DataV
转自https://blog.youkuaiyun.com/orz15/article/details/53081934
2019-07-18 17:10:04
2716
原创 cloudera Java API pom.xml
https://www.cloudera.com/documentation/enterprise/latest/topics/install_software_cm_wizard.html< project > < repositories > < repository > < id > cdh.repo </...
2019-07-16 20:32:32
308
原创 sublime打开txt乱码问题修复
Package Control是Sublime Text3负责插件管理的插件,所以安装Package Control插件时安装其他插件的前提,而Package Control安装方法分为手动安装和自动安装两种,下面是自动安装方法:Package Control的安装详情在官网上边有说明,首先百度搜索Package Control官网,我们便会出现如下的界面。点击右侧绿色的Install Now...
2019-07-13 21:17:38
489
原创 To enable Oozie web console install the Ext JS library解决办法
新集群安装后,oozie还不能打开:解决办法:下载ext-2.2.zip到本机,上传到Oozie Server上对应目录下:whereis ooziecd /var/lib/oozie/sudo yum install unzipsudo unzip ext-2.2.zipchown oozie:oozie -R ext-2.2再次访问web,正常了。...
2019-07-08 20:06:25
387
原创 执行sqoop脚本提示Permission denied
执行sqoop import --connect jdbc:mysql://test.public.db.gdapi.net/etnadb --username etna --password C4rWqW9vvgMFh9om --table etna_function --target-dir /tmp/test报错:解决办法:sudo -u hdfs sqoop import --...
2019-07-08 18:33:51
1080
原创 《hive编程指南》阅读随笔16
hive cli会在本地创建.hivehistory这样的文件,以及会在/tmp目录和hadoop.tmp.dir目录下创建一些条目。hiveserver2成了hadoopjob开启执行的地方
2019-07-04 20:16:01
178
原创 《hive编程指南》阅读随笔15
文件格式、记录格式stored as textfile/sequencefile/文件格式行分隔符字段分隔符记录格式:SerDeRegexSerDe处理标准格式的apache web日志CSVSerDe / TSVSerDe 处理CSV/TSV文件XPath(XML路径语言)JSONSerDeAvro Hive SerDe...
2019-07-04 19:19:53
138
原创 《hive编程指南》阅读随笔04
分区分层存储alter table log_message add partition(month=1) location ‘hdfs://master-server/data/log_messages/month=6’describe extended log_messages;describe extended log_messages pa...
2019-07-04 18:10:12
126
原创 《hive编程指南》阅读随笔02
一次使用命令hive -ehive -S -ehive -S -e “select * from test_table” > /tmp/a.txthive会将输出写到标准输出中。上面的shell命令将输出重定向到本地文件系统,而不是hdfshive CLITab制表符 自动补全...
2019-07-04 14:52:36
172
原创 《hive编程指南》阅读随笔01
CLI:hive命令行界面thrift服务:提供了可远程访问其他进程的服务,也提供了JDBC/ODBC访问hive的功能。JDBC/ODBC:访问hive,都是基于thrift服务来实现的。HWI:hive网页界面,提供了远程访问hive的服务metastore:元数据存储,通常替换为mysqlhadoop dfs 已经不推荐使用,推荐hdfs dfs警告:不推荐使用Hive...
2019-07-04 12:34:48
144
原创 执行本地文件加载在hive中的py脚本及依赖安装记录
脚本demo脚本功能:把本地文件加载在hive中#!/usr/bin/env python # encoding: utf-8 """@version: v1.0@author: chey@contact: ~@software: PyCharm@file: test.py.py@time: 2019-07-03 15:56""""""创建分区表:CREATE TA...
2019-07-03 17:13:55
444
原创 org.apache.hadoop.security.AccessControlException 解决办法
异常1:上传文件到hdfs,找不到文件异常2:spark-shell启动报错org.apache.hadoop.security.AccessControlException: Permission denied: user=root, access=WRITE, inode="/user":hdfs:supergroup:drwxr-xr-x异常3:远程提交任务给Hadoop 可...
2019-07-02 20:15:12
10931
2
原创 Python3安装
必须root下执行,bigdata下sudo执行make && make install 时某些包权限受限,会报错下载安装包:wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz解压:tar -zxvf Python-3.6.1.tgz建立一个空文件夹,用于存放python3程序:mkdir /u...
2019-07-02 20:04:18
239
原创 大数据组件的退出命令
spark-shell 退出 :quithive 退出 quit; exit;beeline 退出 !exithbase 退出 exithadoop job -kill jobid
2019-07-02 19:00:37
391
原创 本地maven仓库清理(.bat)
要清理的内容包括 所有的包含lastUpdated 的文件set REPOSITORY_PATH=D:\repositoryrem 正在搜索...for /f "delims=" %%i in ('dir /b /s "%REPOSITORY_PATH%\*lastUpdated*"') do ( del /s /q %%i)rem 搜索完毕pause.bat...
2019-06-29 12:02:49
6825
原创 反编译.class和原java文件的源码对比
主要是对比字面型常量之间、变量之间以及两者之间运算在编译后的差异源代码:int a=1+2;System.out.println(a);int b=10;int c=20;int d=a+b;System.out.println(d);.class文件反编译int a = 3;System.out.println(a);int b=10;int c=20;...
2019-06-29 12:01:34
4883
原创 Windows快捷打开服务的命令查询表
“开始”—> “运行”输入以下命令,或者Win + R,输入以下命令对我比较有用的几个:31. regedit.exe----注册表48. msconfig.exe---系统配置实用程序 80. services.msc---本地服务设置 93. regedit.exe----注册表 1. gpedit.msc-----组策略 2. sndrec32-----...
2019-06-29 12:00:49
10003
原创 HDFS读写文件流程
HDFS写流程: 写的详细流程: ① 客户端向HDFS写数据,首先跟namenode通信以确认可以写文件(namenode检查目标文件是否存在,父目录是否存在),确认可以上传,返回给客户端client ② client会先对文件进行切分,默认一个block块是128M,比如说,文件有300M,就会被切分成3块,两个128M,一个44M。然后client会向namenode请求上传...
2019-06-29 11:55:27
1066
原创 sqoop+crontab(mysql表定期导入到hive)
执行命令sqoop job --create todbincrementjob -- import \--connect jdbc:mysql://xx.xx.xx.xx:3306/iepdb \--username xxxxx_iep \--password-file /user/train/password.file \ --target-dir /tmp/mysqldb/hs_xx...
2019-06-29 11:38:21
530
原创 airflow分享
组成部分从一个使用者的角度来看,调度工作都有以下功能:系统配置($AIRFLOW_HOME/airflow.cfg)作业管理($AIRFLOW_HOME/dags/xxxx.py)运行监控(webserver)告警(邮件或短信)日志查看(webserver 或 $AIRFLOW_HOME/logs/)跑批耗时分析(webserver)后台调度服务(scheduler)除了短信需...
2019-06-29 11:30:47
2274
原创 airflow安装实操记录
1.1 基础安装1.1.1 默认自带python2环境,自行安装pipsudo yum -y install python-pip使用bigdata用户安装,需要加sudo,否则会出现Permission denied1.1.2 进行pip的更新,否则后续很多安装会报错 sudo pip install --upgrade pip sudo pip install --upgrade...
2019-06-29 11:25:42
445
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人