左瞧瞧右看看-优快云博客

安装流程一、Python 安装二、Airflow 安装三、Airflow 配置四、存在的坑部分安装方法参考： Linux 虚拟机：大数据集群基础环境搭建（Hadoop、Spark、Flink、Hive、Zookeeper、Kafka、Nginx）一、Python 安装当前安装版本为 Python-3.9，使用源码包安装下载源码包或者 wget 下载wget https://www.python.org/ftp/python/3.9.6/Python-3.9.6.tgz解压到指定目录

2023-02-08 09:10:16 1684

原创问题排查记录：服务器 IPv4 转发禁用问题导致 Docker MySQL 无法连接

问题：重启服务器之后无法登录进入系统。

2023-02-07 09:06:35 602

原创 Linux 虚拟机：大数据集群基础环境搭建（Hadoop、Spark、Flink、Hive、Zookeeper、Kafka、Nginx）

基本信息：Centos-7.9、Java-1.8、Python-3.9、Scala-2.12、Hadoop-3.2.1、Spark-3.1.2、Flink-1.13.1、Hive-3.1.3、Zookeeper-3.8.0、Kafka-3.2.0、Nginx-1.23.1目录一、相关文件下载地址二、虚拟机基础配置三、语言环境安装1. Java 环境安装2. Python 环境安装3. Scala 环境安装四、大数据组件安装1. Hadoop 集群安装2. MySQL 安装3. Spark 安装4. F

2023-02-06 08:35:27 6066

原创 Java JVM：线程安全与锁优化（八）

目录一、线程安全二、锁优化一、线程安全当多个线程同时访问一个对象时，如果不用考虑这些线程在运行时环境下的调度和交替执行，也不需要进行额外的同步，或者在调用方进行任何其他的协调操作，调用这个对象的行为都可以获得正确的结果，那就称这个对象为线程安全共同特征代码本身封装了所有必要的正确性保障手段（互斥同步等），令调用者无须关心多线程下的调用问题，更无须自己实现任何措施来保障多线程环境下的正确调用白话文：代码本身已经有了必要的正确性保障手段，像什么互斥同步这些，调用的时候就不需要自己实现任何操作保障多

2023-02-03 08:36:34 312

原创 Java JVM：Java 内存模型与线程（七）

衡量一个服务性能的高低好坏，每秒事物处理数（TPS）是重要的指标之一，而 TPS 值与程序的并发能力又有非常密切的关系目录一、硬件的效率与一致性二、Java 内存模型三、Java 与线程这里是看书笔记，之前文章也有相关介绍：Java JMM：内存模型一、硬件的效率与一致性内存模型：在特定的操作协议下，对特定的内存或高速缓存进行读写访问的过程抽象为了充分利用运算单元，处理器对输入的代码进行乱序执行优化，在计算后将乱序执行的结果重组二、Java 内存模型Java 内存模型的主要目的是

2023-02-02 08:58:58 263

原创 Java JVM：字节码执行引擎（六）

执行引擎是 Java 虚拟机核心的组成部分之一，执行引擎由软件自行实现

2023-01-31 11:45:57 558

原创 Java JVM：虚拟机类加载机制（五）

Java 虚拟机把描述类的数据从 Class 文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被虚拟机直接使用的 Java 类型

2023-01-30 14:10:22 254

原创 Java JVM：Class 类文件结构（四）

> Java 保持良好的向后兼容性，Class 文件结构的稳定功不可没

2023-01-29 15:20:17 259

原创 Python 模型训练：LSTM 时间序列销售额预测（训练、保存、调用）

LSTM (long short-term memory) 长短期记忆网络，具体理论的就不一一叙述，直接开始

2023-01-09 15:46:24 4736 3

原创 Java JVM：虚拟机性能监控、故障处理工具（三）

Java JVM：虚拟机性能监控、故障处理工具

2023-01-06 16:25:50 565

原创 Java JVM：垃圾收集器与内存分配策略（二）

当需要排查各种内存溢出、内存泄漏问题时，当垃圾收集成为系统达到更高并发量的瓶颈时，我们就需要对这些进行监控和调节

2023-01-05 10:23:25 259

原创 Java JVM：内存区域与内存溢出异常（一）

Java JVM：内存区域与内存溢出异常（一）

2023-01-04 11:49:35 219

原创 Kafka 消费者：消费者轮询的准备工作（十五）

Kafka 消费者：消费者轮询的准备工作（十五）

2022-12-30 11:48:25 759

原创 Java 小知识点：Object 问题以及各种小知识点

Java 小知识点：Object 问题以及各种小知识点

2022-12-28 13:32:16 348

原创 Shell 脚本：Hadoop 集群一键安装脚本

一键安装完全分布式 Hadoop 集群脚本

2022-12-27 10:33:30 944

原创 Mac Parallels Desktop 安装 Centos 虚拟机

Mac Parallels Desktop 安装 Centos 虚拟机

2022-12-21 11:58:23 2031 1

原创 Hive SQL：一列按分隔符切分求每个类型占比

Hive SQL：一列按分隔符切分求每个类型占比

2022-12-19 14:06:37 1343

原创 Java 小知识点：JDBC、MyBatis 操作数据库

Java JDBC、Druid、MyBatis XML 和注解方式操作数据库

2022-12-18 19:15:23 178

原创 PySpark MLlib：逻辑回归模型训练过程（训练、评估、编解码、保存、读取）

模型训练流程一、引入 Spark 环境二、设置模型评估方法三、读取/修改数据四、编码、合并列五、模型训练逻辑回归朴素贝叶斯六、模型保存七、读取模型测试数据没有做训练测试集划分，直接全量训练，全量测试一、引入 Spark 环境from pyspark.sql import SparkSessionspark = SparkSession.builder.master("local[*]").getOrCreate()二、设置模型评估方法# 评估from pyspark.ml.evaluati

2022-12-15 08:31:51 1179 1

原创 Java 设计模式：创造者模式（单例、原型、工厂、建造者）

创造者模式包括单例模式、原型模式、工厂方法模式、抽象工厂模式、建造者模式

2022-12-13 10:12:39 578

原创 Python 模型训练：逻辑回归、KNN、朴素贝叶斯、LDA、支持向量机、GBDT、决策树

常用的分类预测模型：逻辑回归、KNN、朴素贝叶斯、LDA、SVC、GBDT、决策树

2022-12-12 23:14:44 5083

原创 Python Pandas：DataFrame 一列切分成多列、分隔符切分选字段

Python Pandas：DataFrame 一列切分成多列、分隔符切分选字段

2022-12-10 12:42:49 11666

原创 Spark 调优：数据倾斜解决方案、Shuffle、Stage

数据倾斜导致的后果，一般是 OOM 或者速度异常慢

2022-12-09 09:44:18 472

原创 Java JNI：Native 方法调用 C++ 程序

Java JNI：Native 方法调用 C++ 程序（Mac 环境）

2022-12-08 11:08:41 300

原创小知识点：Docker 安装、命令、Dockerfile ...

Docker 安装、命令、Dockerfile、SpringBoot 打包、...

2022-12-07 10:27:53 425

原创 Java Netty：核心模块（二）

Netty 核心模块：Bootstrap、ServerBootstrap、Future、ChannelFuture、Channel、ChannelHandler、Pipeline、ChannelPipeline、ChannelHandlerContext、ChannelOption、EventLoopGroup、NioEventLoopGroup、Unpooled

2022-12-06 10:13:59 492

原创 Java Netty：基础入门（一）

Netty：异步的，基于事件驱动的网络应用框架，快速开发高性能的服务端和客户端

2022-12-05 10:30:17 1042

原创 Java IO：BIO、NIO

3种网络编程 I/O 模型：BIO、NIO、AIO

2022-12-04 17:01:38 178

原创 Kafka 消费者：案例代码、订阅方式和状态解析（十四）

Kafka 消费者案例代码，订阅方式和状态解析

2022-12-03 16:56:10 1342

原创 Zookeeper 应用：Java 基本操作

Zookeeper：分布式协调服务，数据存储在内存中（每个节点不超过 1M），采用分层存储结构，可以通过不同的路径访问到不同的节点。

2022-12-02 14:18:57 228

原创 Java JMM：内存模型

Java 多线程内存模型跟 cpu 缓存模型类似，基于 cpu 缓存模型来建立，Java 线程内存模型是标准化的，屏蔽掉了底层不同计算机的区别。

2022-12-01 17:34:24 176

原创 Java JVM：内存、垃圾回收、并发锁机制

JVM 运行在操作系统上，与硬件没有直接的交互，是可运行 Java 代码的虚拟机。

2022-11-30 17:36:49 336

原创 Kafka 服务端：请求处理（十三）

KafkaServer 会创建请求处理线程池 KafkaRequestHandlerPool，在请求处理线程池中会创建并启动多个请求处理线程 KafkaRequestHandlerrequestHandlerPool = new KafkaRequestHandlerPool(config.brokerId, socketServer.requestChannel, apis, config.numIoThreads)SocketServer 中全局的请求通道会传递给每个请求处理线程，这样就能共同消

2022-11-29 08:53:28 297

原创 Kafka 服务端：RequestChannel 请求队列和响应队列（十二）

在 KafkaServer 中，会将 SocketServer 的请求通道传给 Kafka 请求处理线程 KafkaRequestHandler 和 KafkaApis请求通道就是处理器与请求处理线程和 KafkaApis 交换数据的地方如果处理器往请求通道添加请求，请求处理器线程和 KafkaApis 都可以获取到请求通道中的请求如果请求处理线程和 KafkaApis 往请求通达添加响应，处理器也可以从请求通道获取响应处理器会将客户端发送的请求放到全局的请求队列（requestQueu

2022-11-28 13:09:51 802

空空如也

空空如也