自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (4)
  • 收藏
  • 关注

原创 hive 慢sql 查询

解析日志 获取 执行时间 执行 OperationId 执行人 UserName=root 执行sql 数据分隔符为 \001 并写入 hivesql.txt。比如:/var/log/Bigdata/audit/hive/hiveserver/hive-audit.log。查找 hive 执行日志存储路径(一般是 hive-audit.log )上传相关解析日志到hive。hive 慢sql 查询。

2024-04-03 10:16:20 867

原创 presto 不支持窗口函数 count(distinct ) 替换方案

sort 升序排列获取当前列之前的所有 role_uid ,通过 array_agg聚合,在通过 cardinality(array_distinct( array_role )) ,array_distinct 进行角色的去重,cardinality统计角色个数,在通过max() 获取分组数据。

2024-03-11 14:57:35 642 1

原创 python3 win环境部署

安装成功后 ctrl+r 输入 cmd 执行 python 检验是否安装成功。自用依赖 requirements.txt。创建 pip.ini 文件修改镜像源。自行下载路径上的文件手动安装。在pip.ini文件添加。pip 版本更新超时处理。

2023-10-20 16:18:32 284

原创 dolphinscheduler3.1.1 部署

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dAemE0AY-1669973901677)(https://gitee.com/yx9119/imgs/raw/master/PidGo_imgs/image-20221202170937125.png)]dolphinscheduler 下载地址: https://dolphinscheduler.apache.org/zh-cn/download/download.html。

2022-12-02 17:40:50 1639

原创 dolphinscheduler 删除已加载资源错误:

[ERROR] 2022-10-19 17:44:25.245 org.apache.dolphinscheduler.server.master.runner.task.CommonTaskProcessor:[157] - submit task Exception: java.lang.NullPointerException: null

2022-10-19 18:04:10 481

原创 excel动态创建hive表语句模板

excel动态创建hive表语句模板介绍:通过给定的字段类型 以及分区字段 自动生成右侧的SQL语句模板下载地址:https://download.youkuaiyun.com/download/Kafka_yx/20419760

2021-07-22 14:36:22 222

原创 drools 更新规则包下面的规则

drools 更新规则包下面的规则​效果说明​ 当我在运行的过程中想添加规则到指定的 规则包下面的时候 可以使用@Test public void test117() throws Exception { String drlStr="package rules;" + "\n" + "rule \"test\"\n" + "when\n"

2020-07-24 17:29:16 472

转载 drools 规则引擎使用手记

drools 规则引擎使用手记文章目录drools 规则引擎使用手记规则的组成部分:规则结构:包(Package)导包 (import)全局变量(global)函数(Function)规则属性运算符“&&”,“ ||”,“ ,”优先级支持嵌套的表达式使用说明:​ 通过页面自定义动态规则,实现气象数据的动态阈值监测告警,当阈值被触发的时候,后台的规则就会做出相应的反应,然后提示触发的是什么规则,已经触发的规则阈值是多少,数据主要来源于实时的气象站点和预报数据。规则的组成部分:规

2020-07-24 17:09:37 878

原创 Elasticsearch max min 等查询 数据精度丢失

Elasticsearch 数据精度丢失 如果字段数据类型设置的为 float 就会出现聚合查询的时候出现精度丢失测试例如 设置字段 tmp 类型为 float{ "took" : 6, "timed_out" : false, "_shards" : { "total" : 1, "successful" : 1, "skipped" : 0, "failed" : 0 }, "hits" : { "total" : {

2020-07-24 15:48:12 1360

原创 CDH 部署 Elasticsearch

制作Elasticsearch的Parcel包和csd文件制作Elasticsearch的Parcel包和csd文件将Parcel包和manifest.json文件部署到httpd服务中制作Elasticsearch的Parcel包和csd文件借鉴地址:https://www.cnblogs.com/zhangrui153169/p/11447423.html配置java,maven等环...

2020-03-27 11:27:11 1031

原创 kafka 生产者压力测试

kafka 生产者压力测试kafka-producer-perf-test --topic test2 --num-records 100000 --record-size 20 --throughput 1000 --producer-props bootstrap.servers=172.22.42.241:9092–num-records 生产的数据量–record-size 一...

2020-03-24 17:58:00 362

原创 Typora+PicGo 图片插入自动上传GitHub

Typora+PicGo 图片插入自动上传环境安装配置环境​ PicGo : 需要是2.2.0以上的版本(PicGo 的配置请看博客https://editor.youkuaiyun.com/md/?articleId=104407427)​ 下载地址:https://molunerfinn.com/PicGo/ 应用说明:https://picgo.github.io/PicGo-Doc/zh/...

2020-03-24 12:56:59 450

原创 hbase mapredc 使用

使用hbase 集成的 hbase-server-0.98.6-hadoop2.jar 进行数据的导入统计等相关操作命令:HADOOP_CLASSPATH=`hbase mapredcp`:/etc/hbase/conf yarn jar /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/hbase/hbase-server...

2020-03-23 18:36:30 237

原创 sqoop 1.4.7 cdh版本 hive 导出数据到 mysql 8版本问题记录

导出到mysql的数据出现数据错位。hive数据mysql8 数据​ 数据错位对比​ 测试:在 同样一份数据的情况下 使用mysql 5 版本的数据存储数据(发现不存在数据错位的情况)​ 补解:经过查看官网文档 (http://sqoop.apache.org/docs/1.4.7/SqoopUserGuide.html#_mysql)发...

2020-02-26 11:38:27 782

转载 PicGo + GitHub 搭建个人图床工具

取代 七牛云+Mpic 方...

2020-02-20 11:27:41 268

原创 postgresql(windows版本) 插件wal2json 通过 Visual Studio 2019 编译

postgresql(windows版本) 插件wal2json 通过 Visual Studio 2019 编译下载相关插件:Visual Studio 2019下载地址安装wal2json 编译Visual Studio导入 wal2json 项目添加postgresql 相关的依赖下载相关插件:Visual Studio 2019下载地址https://visualstudio.m...

2020-01-09 17:53:09 1080 1

原创 全端口映射(继于 frp 和NR)

全端口映射场景准备配置Sakura Frp 端口映射配置Sakura Frp客户端安装 NeoRouter服务端(和Sakura Frp 同一台机器)安装 NeoRouter 客户端场景​ 有时候我们需要访问家里或者公司的服务等相关的东西,例如:A 电脑需要访问 B 电脑所有的所有端口,不需要挨个的进行端口映射。准备在 https://www.natfrp.com/page...

2019-12-18 18:06:05 8296 4

原创 sqoop 任务配置

sqoop 任务配置1:tws_orderMySQL 中的tws增量数据到hive缓存表dm数据到239 mysql数据库:dwd数据到239 mysql数据库执行命令前提 :sqoop 的元数据存储在mysql 里面 172.22.42.2441:tws_orderMySQL 中的tws增量数据到hive缓存表sqoop-job \--create tws_order_add_job...

2019-11-28 20:45:29 705 2

原创 debezium postgresql 连接示例

postgresql 连接示例连接器属性查看pgsql已有的插槽 select * from pg_replication_slots;指定表(迁移 postgres 数据库下的 test 表,多个表需要用 逗号分隔 )curl -i -X POST -H "Accept:application/json" -H "Content-Type:application/json" h...

2019-11-28 17:36:58 3930

转载 postgresql 热备

参考文档:备机日志传送:https://www.postgresql.org/docs/9.6/static/warm-standby.html 英文文档:https://www.postgresql.org/docs/current/static/index.html中文文档:http://www.postgres.cn/docs/9.6/pg_basebackup:http...

2019-11-26 17:33:42 822

原创 postgresql 流复制(热备)

postgresql 流复制(热备)postgresql 用户授权创建流复制用户配置master端的访问文件 pg_hba.conf重启服务从库配置基础备份备份目录权限postgresql 用户授权进入 pg_sql 数据目录 data (例如:G:\Program Files\PostgreSQL\9.6\data) 打开 pg_hba.conf# TYPE DATABA...

2019-11-26 17:08:16 574

原创 postgresql(windows版本) 插件wal2json 通过 Visual Studio 2019 编译

postgresql(windows版本) 插件wal2json 通过 Visual Studio 2019 编译下载相关插件:Visual Studio 2019下载地址安装wal2json 编译Visual Studio导入 wal2json 项目添加postgresql 相关的依赖下载相关插件:Visual Studio 2019下载地址https://visualstudio.m...

2019-11-25 16:12:22 1351

原创 DATAX 使用记录

DATAX 使用记录批量表迁移准备表准备datax .json文件准备执行脚本.sh批量表迁移准备表vim mysqltables.txttb_consultation_typetb_conversation_recordtb_relation_record_consultationtb_relation_student_grouptb_relation_teacher_coll...

2019-11-07 11:50:05 1451

原创 配置 debezium

文章目录配置debezium示例debezium 相关命令mysql 链接sql server 链接配置配置debezium提交Connector用户配置curl 'http://10.100.11.36:8083/connectors' -X POST -i -H "Content-Type:application/json" -d '{\"name": "yxconnectors",...

2019-11-07 11:19:38 1860

原创 磁盘容量分区

文章目录磁盘容量在 2T 以下的磁盘做(LVM)分区查看新加入的磁盘详细磁盘容量在 2T 以上的磁盘做(LVM)分区命令集创建物理卷(pv)格式化 & 挂载Linux开机自动挂载磁盘容量在 2T 以下的磁盘做(LVM)分区查看新加入的磁盘详细fdisk -l对磁盘进行分区fdisk /dev/xvdb  1,输入:n  表示创建一个新的分区(new的意思)  2...

2019-11-07 11:06:07 298

原创 大数据部署手册(个人)

大数据部署手册(个人)安装包下载MySQL 下载:CDH 下载kafka 下载服务器hosts 配置关闭防火墙免密配置时间同步安装 MySQL删除过期文件部署 MySQL初始化数据库创建 cm 组件需要的 数据库**安装cloudera-manager-5.4.3**安装包下载MySQL 下载:下载mysql地址:http://dev.mysql.com/downloads/mysql/5...

2019-11-07 10:50:47 298

转载 博客转载f12然后搜索markdown_views 负责 粘贴即可

龙云尧个人博客,转载请注明出处。优快云地址:http://blog.youkuaiyun.com/michael753951/article/...

2019-11-07 10:45:24 252

原创 picgo 图床 图片不能加载

文章目录一、图片加载失败1.1 获取URL1.2 获取IP2.3 修改hosts文件二、GitHub加载缓慢或者失败小结一、图片加载...

2019-11-07 10:42:12 4903 4

原创 hive 限制需要输出的字段

hive 限制需要输出的字段建表语句CREATE TABLE `adminuser`( `id` int, `adminname` string, `adminpwd` string, `creationtime` string, `updatetime` string, `role` int, `name` string, `tel` str...

2019-10-24 11:49:47 413

原创 sql server 配置 日志跟踪

sql server 配置配置 日志跟踪配置 日志跟踪(sql server profiler)启动SQL Server 的日志跟踪flume 配置配置conf文件flume 执行命令kafka 主题创建创建主题消息生产消息消费数据从新采集配置sql server 配置配置 日志跟踪(sql server profiler)在win系统下面的开始菜单中找到 sql server profi...

2019-10-14 22:29:02 1010 1

原创 sql server + sqoop 全库导入hive 手记

sqoop-import-all-tables \--connect "jdbc:sqlserver://10.100.11.45:1433;instanceName=dbo;DatabaseName=yxtest;integratedSecurity=false" \--username sa \--password abashifanSmart201905.../// \--hi...

2019-10-14 22:16:46 435

原创 sql server2008 cdc 数据实时同步到kafka

sql server2008 cdc 数据实时同步到kafkasql server 2008 开启 cdc开启数据库 cdc (只能对有主键或者有唯一索引的表开启cdc)查看sql server的代理状态关闭​ 开启EXECUTE sys.sp_cdc_enable_db开启后如图会自动创建一个 数据库实例为 cdc 并包括以下表#### CDC 表说明cd...

2019-10-14 22:02:11 2333 1

转载 kafka数据可靠性深度解读

1 概述Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark等都支持与Kafka集成。Kafka凭借着自身的优势,越来越受到互联网企业的青睐,唯品会也采用Kafka作为其内部核心消息引擎之一。Kafka作为一...

2019-04-09 11:10:38 222

原创 xshell安装错误提示:无法打开键.UNKNOWNY\Components\5FAA65EAOC3FB4D388951A**解决

首先进入注册表 regedit 然后依次进入目录HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Installer\UserData\S-1-5-18\Components右键选择权限:添加自己的用户(比如本人的是 兴雨 (***@163.com) 依次点击 1 、2然后确定 然后给此用户赋予完全控制...

2019-04-09 11:01:05 2233

excel动态创建hive表语句模板.xlsx

excel 根据字段创建 hive表

2021-07-22

ELASTICSEARCH-1.0.jar

cdh 集成 ELASTICSEARCH 所需要的 parcel manifest.json csd 文件 ELASTICSEARCH-1.0.jar 需要放入 cloudera/csd 目录下 上传的 空间有限 需要自行联系

2020-03-27

wal2json.dll

debezium 对接postgresql windows版的wal2json,需要的小伙伴 下载使用即可

2019-11-18

解决sqoop2 数据分隔符为 ',' 以及 string类型数据存在单引号('数据')问题(通过改变源码编译解决 ---可以从源头彻底解决)

说明: 版本为:sqoop2-1.99.5-cdh5.10.2 解决数据分隔符 以及 string类型数据存在单引号问题(解决方式 通过更改源码SqoopIDFUtils 里面的分隔符来解决此问题 ) ​ 只需要将以下包进行替换 connector-sdk-1.99.5-cdh5.10.2.jar 即可需要替换的包路径为:sqoop-1.99.5/server/lib/ (如不妥之处还请指教 )

2019-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除