自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 StreamPark集成k8s运行Flink

1.然后在有docekr的机器上登录。2.设置下命名空间(左侧)

2024-09-08 18:19:32 817 1

原创 kafka副本同步时HW和LEO

对应关系(先写这么多。

2025-03-31 18:51:48 258

原创 kafka压缩

最近有幸公司参与kafka消息压缩,背景是日志消息量比较大。kafka版本2.4.1。

2025-03-21 21:35:38 709

原创 解决win11的vmvare和docker冲突

【代码】解决win11的vmvare和docker冲突。

2025-01-13 21:59:01 535

原创 k8s 安装ingress并配置flink服务

参考。

2025-01-12 00:10:13 347

原创 使用Dinky快速提交Flink operator任务

上传任务jar包复制地址。右键复制jar包地址。比如rs:/flink-test-1.0-SNAPSHOT.jar。3.数据库配置要写静态ip,别写127.0.0.1.不然会报错。1.修改这里的Dinky地址,不然会下载报错。2.集群配置地址时。

2025-01-05 16:47:34 691 2

原创 Flink operator实现自动扩缩容

operator通过监控prometheus实现自动扩缩容,过两天调整为helm。

2025-01-01 23:27:23 735

原创 Ftp目录整个下载

最近有个需求是要下载ftp接近十个T的数据,在调研过多个工具后发现还是lftp的mirror最省事。

2024-12-22 11:08:18 288

原创 Flink1.19编译并Standalone模式本地运行

新建local_conf和local_lib文件夹,并且将编译后的文件放入对应的目录。

2024-11-14 21:47:45 635

原创 Flink一点整理

例如,一个最大并行度为10,每个TaskManager有两个任务槽的作业,就会启动5个TaskMana。

2024-10-04 16:17:18 530

原创 Doris规范

3.2 没有办法分区的,数据又较快增长的,没办法按照时间动态分区,可以适当放大一下你的bucket数量,按照你的数据保存周期(180天)数据总量,来估算你的bucket数量应该是多少,建议还是单个bucket大小在1-3G。2.【强烈建议】不要使用Auto Bucket ,按照自己的数据量来进行分区分桶,这样你的导入及查询性能都会得到很好的效果,Auto Bucket 会造成 tablet 数量过多,造成大量小文件的问题。3.1 没有办法分区的,数据又缓慢增长的:单个tablet数据量保持在1-3G;

2024-09-30 11:42:35 1506

原创 IDEA远程调试Dinky

最近发现本地和服务器上同样的包但是服务器上的服务报错,特此debug点击RUN---edit configuration。

2024-09-24 11:04:31 268

原创 Datasophon集成tez

【代码】Datasophon集成tez。

2024-09-22 08:19:55 208

原创 Dinky1.1.0集成paimon0.9

2024-08-17 10:43:15 289

原创 datasophon升级海豚调度为3.2.1

修改启动命令,添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。修改启动命令,添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。2、在worker-server的启动命令中添加api-server的jmx端口号。1、同api-server的修改一致,否则任务启动时无法找到hdfs路径文件。修改master-server的启动脚本。修改worker-server的启动脚本。

2024-08-13 20:34:23 619

原创 逆向app 思路整理

使用小黄鸟Reqable即可,如果抓不到那就是代理被屏蔽了。3.Frida代码编写。

2024-08-07 23:02:26 425

原创 JS hook

debugger 使用 Function.constructor / setInterval / eval。一般获取header中的参数。

2024-07-01 22:44:11 1013

原创 某平台小程序逆向思路整理

python调用解密即可。打断点进入这个加密的方法。

2024-06-26 17:58:23 549

原创 记录dinky0.6.7+flink1.14.5集成问题

先说一句mmp,这个jar包冲突搞吐我。如果有遇到math3问题需要注意少个包。中配置好flink在hdfs上的lib目录。注意dinky0.6.7版本时的。

2024-06-26 15:20:42 541

原创 yolov8训练初体验

最近在爬一些数据,有些网址的验证码比较难搞,于是使用yolov8来解决。

2024-06-22 22:26:29 765 1

原创 空间验证码训练集获取

最近有个需求在爬取数据时碰到验证码。准备使用yolov8训练模型但没有训练集。基本就是这个大佬的代码:我稍作改动。

2024-06-19 21:52:48 173 3

原创 Datasophon基于dinky1.0.1升级到dinky1.0.2

opt/datasophon目录原来有软链接指向/opt/datasophon/dinky-release-1.16-1.0.1。之后到服务器查看是否是1.0.2启动。jps -ml 查看dinky进程。我给取消了不知道影不影响。

2024-05-08 19:21:48 533

原创 Datasophon1.2.1集成Dinky1.0.1

通过下图展示的url进去grafana配置图表,默认登陆账户密码:admin :admin。回到datasophon的dinky服务,刷新即可在总览看到详细监控信息。进入datasophon-manager-1.2.1中。重启datasophon-manager的api。配置目录下添加配置模板。

2024-04-26 21:43:34 1017 1

原创 umi-ocr识别文件夹所有文件并导入数据库

最近有个需求是识别身份证所有信息。所以调用umi-ocr接口并写入mysql。

2024-04-05 14:28:38 775

原创 Flink中流式的各种聚合

针对无界聚合算子,

2024-03-24 12:51:36 552 1

原创 在Flink SQL中使用watermark进阶功能

在Flink SQL中使用watermark进阶功能在Flink1.18中对Watermark的很多进阶功能(比如watermark对齐)通过datastream api很容易使用。在sql中使用不是很方便,在Flink1.18中对这些功能进行扩展。在sql中也能使用这些功能。只有实现了接口的源连接器(source connector)(比如kafka、pulsar)才可以使用这些进阶功能。这些进阶的功能都可以使用dynamic table options或 hint进行配置,如果用户同时使用dynamic

2024-03-24 09:55:45 2124

原创 Flink1.18 如何配置算子级别的TTL

举例来说,假设一个 ETL 作业使用 ROW_NUMBER 进行去重操作后, 紧接着使用 GROUP BY 语句进行聚合操作。您可以为去重算子和聚合算子的状态分别设置不同的 TTL。双流 Join 会生成拥有两条输入边TwoInputStreamOperator的状态算子,它用到了两个状态,分别来保存来自左流和右流的更新。table.exec.state.ttl 来控制状态保留,因此它们的状态无法在算子级别进行配置。中,系统会根据两个数据流中元素的时间戳和定义的间隔来决定哪些元素应该被连接在一起。

2024-03-22 19:52:07 770 1

原创 hive的kerberos记录

【代码】hive的kerberos记录。

2024-03-05 10:00:56 444

原创 Apache celeborn 安装及使用教程

因为在配置文件中已经配置了master 所以启动matster和worker即可。

2024-02-24 17:02:56 1286

原创 对比pg主从库一致性

【代码】对比pg主从库一致性。

2024-01-05 16:58:58 612

原创 k8s之flink的几种创建方式

在此之前需要部署一下私人docker仓库,教程注意:每台节点的daemon.json都需要配置并重启。

2024-01-03 17:18:05 2668

原创 dinky1.0 同步PG 时 修改数据类型

【代码】dinky1.0 同步PG 时 修改数据类型。

2023-12-26 10:27:47 545

原创 k8s实战之ELK日志管理

【代码】k8s实战之ELK日志管理。

2023-12-25 20:58:23 1255

原创 Helm 包管理器

【代码】Helm 包管理器。

2023-12-12 15:47:24 460

原创 k8s之身份认证与权限

Kubernetes 中提供了良好的多租户认证管理机制,如 RBAC、ServiceAccount 还有各种策略等。通过该文件可以看到已经配置了 RBAC 访问控制。

2023-12-11 14:45:19 718

原创 k8s之高级调度

Pod 亲和力:将与指定 pod 亲和力相匹配的 pod 部署在同一节点。节点亲和力:进行 pod 调度时,优先调度到符合条件的亲和力节点上。Pod 反亲和力:根据策略尽量部署或不部署到一块。

2023-12-10 22:33:10 628

原创 k8s之存储管理

使用 kubectl create configmap -h 查看示例,构建 configmap 对象。

2023-12-10 21:28:51 1231

原创 在k8s中部署nfs-client-provisioner

通过这个流程,nfs-client-provisioner 实现了动态创建和管理基于 NFS 的 PV,减轻了管理员的工作负担,同时使开发人员能够更轻松地使用动态的存储资源。需要注意的是,确保您在 PVC 和 StorageClass 的定义中提供正确的配置信息,以确保 nfs-client-provisioner 能够与 NFS 服务器正确交互。

2023-12-09 11:18:29 2573

原创 导入pgsql中的保存的html数据到hive时,换行符无法被repalce

最终发现可以使用chr(ASCII码) 可以匹配到,坑我好久。

2023-12-08 14:00:53 555

原创 k8s之服务发布

Ingress 可以理解为也是一种 LB 的抽象,它的实现也是支持 nginx、haproxy 等负载均衡服务的。k8s会根据service关联到pod的podIP信息组合成一个endpoint。各环境访问名称统一、访问 k8s 集群外的其他服务、项目迁移。

2023-12-03 22:17:30 390

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除