自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 npm报错 npm ERR! Error while executing:npm ERR! ,npm 启动以及安装过程的各种报错

可以使用 increase-memory-limit 脚本或 --max-old-space-size 选项来增加内存限制,脚本会自动增加 Node.js 进程的内存限制,然后运行 node app.js 命令。我的所有问题都是从这个错误开始的,由于项目是个老项目,依赖包也比较大,所以就会报这个134 内存溢出的问题,咱就按正常流程走一遍来详细解决这个问题。友情提醒:如果项目比较老,包又大,又有一些需要权限的特定包,下载不下来的话,直接把同事包copy过来算了哈哈哈哈哈,不然折腾的老费劲了。

2025-04-08 22:22:19 920

原创 Drools项目实战

Drools 实战项目,手把手实操教学

2025-04-05 16:01:15 800

原创 WorkBench安装使用

WorkBench是KIE组件中的元素,也称为KIE-WB,是Drools-WB与JBPM-WB的结合体。它是一个可视化的规则编辑器。

2025-04-05 15:37:10 732

原创 规则引擎Drools

规则引擎 全称为业务规则管理系统,英文名为BRMS,规则引擎的主要思想是将应用程序中的业务决策部分分离出来,并使用预定义的语义模块编写业务规则,由用户或开发者在需要时进行配置和管理。需要注意的是规则引擎并不是一个具体的技术框架,而是指的一类系统,即业务规则管理系统。目前市面上具体的规则引擎产品有:drools、VisualRules、iLog等。规则引擎实现了将业务决策从应用程序代码中分离出来,接收数据输入,解释业务规则,并根据业务规则做出业务决策。规则引擎其实就是一个输入输出平台。drools 是一款

2025-04-04 18:39:34 1016

原创 大数据电商数仓项目--实战(二)DWD层搭建

先将包含action字段的日志过滤出来,然后通过UDTF函数,将action数组“炸开”(类似于explode函数的效果),然后使用get_json_object函数解析每个字段。先将包含display字段的日志过滤出来,然后通过UDTF函数,将display数组“炸开”(类似于explode函数的效果),然后使用get_json_object函数解析每个字段。页面日志解析思路:页面日志表中每行数据对应一个页面访问记录,一个页面访问记录应该包含日志中的公共信息和页面信息。我是通过会话设置的,并不是永久的。

2024-10-15 19:11:20 1103 1

原创 大数据电商数仓项目--实战(一)数据准备

Hive 引擎包括:默认MR ,tez ,sparkHive on Spark 既作为 存储 元数据 又负责 SQL的解析优化 语法是HQL语法Spark on Hive :Hive只作为存储元数据,Spark 负责SQL解析优化 语法是Spark SQL语法什么是拉链表:拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效开始日期。

2024-09-27 19:29:02 1679 1

原创 Spark优化

Spark调优

2024-08-16 10:02:14 1483

原创 SparkStreaming

需要继承Receiver,并实现onStart、onStop方法来自定义数据源采集。

2024-08-16 09:21:03 2320

原创 SparkSQL

sparkSQL操作各种数据

2024-08-13 11:36:06 1094

原创 Spark内核

Spark2.x版本使用Netty通讯框架作为内部通讯组件。Spark 基于Netty新的RPC框架借鉴了Akka的中的设计,它是基于Actor模型,如下图所示:Spark通讯框架中各个组件(Client/Master/Worker)可以认为是一个个独立的实体,各个实体之间通过消息来进行通信。

2024-08-12 08:45:49 1120

原创 大数据技术之Spark

Spark是一种基于内存的快速,通用,可扩展的大数据分析计算引擎​RDD 叫做弹性分布式数据,是Spark中最基本的数据处理模型。

2024-08-10 11:15:41 691

原创 HBase

Hbase的功能和应用场景是什么?功能:能够实现实时分布式随机数据存储场景:大量的结构化数据,实时,随机,持久化存储Hbase的基本存储结构是什么?设计:分布式大量数据实时存储分布式内存【进程】+分布式磁盘【HDFS】实现:NameSpace:类似于数据库概念,访问表的时候必须加上NSTable:就是表概念,表是分布式的,一张表可以有多个分区Region,每个分区可以 存储在不同的节点上。

2024-05-30 11:02:47 1377

原创 大数据技术之Scala语言,只需一篇文章即可,教你学会什么是Scala,教你如何使用Scala

Scala的集合有三大类:序列Seq,集Set,映射Map,所有的集合都扩展自Iterable特质。对于几乎所有的集合类,Scala都同时提供了可变和不可变版本,可变集合可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。而不可变集合类,相比之下,永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变,所以这里的不可变并不是变量本身的值不可变,而是变量指向的那个内存地址不可变。

2024-05-28 17:45:14 5817

原创 究极完整版!!Centos6.9安装最适配的python和yum,附带教大家如何写Centos6.9的yum.repos.d配置文件。亲测可行!

究极完整版!!Centos6.9安装最适配的python和yum,附带教大家如何写Centos6.9的yum.repos.d配置文件。亲测可行!

2024-05-16 13:09:05 868

原创 大数据队列Kafka

kafka内容学习

2024-03-11 15:59:37 1068 1

原创 Apache 辅助系统工具

概述flume是一款大数据中海量数据采集传输汇总的软件。特别指的是数据流转的过程,或者说是数据搬运的过程。把数据从一个存储介质通过flume传递到另一个存储介质中。核心组件source:用于对接各个不同的数据源sink: 用于对接各个不同存储数据的目的地(数据下沉地)channle:用于中间临时存储缓存数据运行机制flume本身是java程序,在需要数据采集的机器上启动agent进程agent进程里面包含了:source sink channel。

2024-01-25 16:02:24 1528

原创 jQuery (JavaScript)进阶使用

(元素).事件方法名1(要执行的功能);$(元素).事件方法名2(要执行的功能);

2024-01-25 16:01:26 1204

原创 Javaweb 服务

会话:浏览器和服务器之间的多次请求和响应,为了实现一些功能,浏览器可能会产生多次请求和响应,多次响应加在一起就称之为浏览器和服务器之间的一次会话会话过程中产生的一些数据,可以通过会话技术(Cookie和Session保存)。Cokkie:客服端会话管理技术,把要共享的数据保存到客户端,每次请求时,把会话信息带到服务器端,从而实现多次请求的数据共享。

2024-01-25 15:59:22 856

原创 Apache Shiro 安全框架

Realm域:Shiro从Realm获取安全数据(如用户、角色、权限),就是说SecurityManager要验证用户身份,那么它需要从Realm获取相应的用户进行比较以确定用户身份是否合法;也需要从Realm得到用户相应的角色/权限进行验证用户是否能进行操作;可以把Realm看成DataSource,即安全数据源/*** 自定义Realm 处理登录 权限*/@Autowired@Autowired@Autowired/*** 授权*/@Override// 角色列表。

2024-01-25 15:54:56 1843

原创 Redis学习(linux)

Redis的安装分为windows版和linux版。此篇介绍linux版

2023-12-24 23:33:36 1053

原创 网站流量日志分析

js和html页面耦合在一起 不利于后续js维护把js单独提取变成一个文件 然后通过src属性引入页面 进行所谓解耦合一台服务器身兼多职 压力过大 降低服务器请求压力单独的去部署服务器 专门用于采集数据的请求响应可能会产生跨域问题(限制js跨域的数据发送)以请求图片的形式 把采集的数据拼接成为图片的参数 发送到指定的服务器上去 绕开js跨域问题。

2023-12-06 22:07:39 1644

原创 如何解决nginx在记录post数据时 中文字符转成16进制的问题

在遇到错误得时候,我们往往不知道该怎么搜索此类答案,我想大家应该都会把错误信息放在搜索引擎中搜索,关键字要随着搜索得到的信息从而不断变化,才能往根源得问题靠近。在搜索引擎给出的大量信息,要懂得抓取有用的信息,不能忽视已经给出问题答案的信息,即使信息比较久远。像阶段1得情况,我如果仔细阅读上面得解答信息,应该会很快得找到问题所在的根源。Nginx/* 这是十六进制字符表 *//* 这是ASCII码表,每一位表示一个符号,其中值为1表示此符号需要转换,值为0表示不需要转换 *//*?>=

2023-11-20 18:21:13 448

原创 Apache Impala

因此在安装impala的时候,需要使用rpm包来进行安装。impala 的配置目录为/etc/impala/conf,这个路径下面需要把 core-site.xml,外部命令是指不需要进入impala-shell交互命令行就可以执行的命令,可以在启动 impala-通过配置/etc/default/impala 中可以发现已经指定了 mysql 驱动的位置名字。在所有需要安装impala的节点上,因为impala需要引用hive的依赖包。服务并且配置好,是决定 impala 是否启动成功并使用的前提。

2023-11-06 21:18:51 567

原创 Hive的高级操作以及调优

2.1 概述:Hive 自带了一些函数,比如:max/min等,当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF).根据用户自定义函数类别分为以下三种:一进一出聚集函数,多进一出countmaxmin一进多出如lateralviewexplore()编程步骤:继承org.apache.hadoop.hive.ql.UDF需要实现evaluate函数;evaluate函数支持重载;注意事项。

2023-10-31 18:53:14 119

原创 数据仓库Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。hive可以理解为一个将SQL转化为MapReduce的任务工具。

2023-10-28 17:48:01 112

原创 Hadoop高可用环境搭建文档

node03机器执行以下命令启动jobHistory。将第一台机器的安装包发送到其他机器上。node01机器查看hdfs状态。node02机器查看hdfs状态。第一台机器执行以下命令进行解压。node01机器执行以下命令。更改node02的rm2。第一台机器执行以下命令。第一台机器执行以下命令。第一台机器执行以下命令。第一台机器执行以下命令。三台机器上共同创建目录。第二台机器执行以下命令。三台机器执行以下命令。node02上面执行。node03上面执行。node03上面执行。node02上面执行。

2023-10-19 10:44:27 134

原创 HDFS的介绍与使用

在Hadoop 中,NameNode 所处的位置是非常重要的,整个HDFS文件系统的元数据信息都由NameNode 来管理,NameNode的可用性直接决定了Hadoop 的可用性,一旦NameNode进程不能工作了,就会影响整个集群的正常使用。2.在典型的HA集群中,两台独立的机器被配置为NameNode。在工作集群中,NameNode机器中的一个处于Active状态,另一个处于Standby状态。Active NameNode负责群集中的所有客户端操作,而Standby充当从服务器。

2023-10-18 23:32:16 754

原创 Hadoop的准备工作:安装,配置文件修改以及集群启动

Hadoop最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。2003年、2004年谷歌发表的两篇论文为该问题提供了可行的解决方案。——分布式文件系统(GFS),可用于处理海量网页的存储——分布式计算框架MAPREDUCE,可用于处理海量网页的索引计算问题。

2023-10-16 15:16:58 193

原创 linux上yum 安装报错

知道是yum源的问题,但是找了很长时间都没有找到一个能用的,再极度不服的心理状态下终于有了回报:get到一个yum源,分享一下,希望对有需要得人有用。这里的问题是版本问题。

2023-10-12 01:20:22 1004

原创 Zookeeper组件的介绍,安装和基本使用。

Zookeeper 是一个开源的分布式协调服务框架 ,主要用来解决分布式集群中应用系统的一致性问题和数据管理问题Zookeeper 本质上是一个分布式文件系统, 适合存放小文件,也可以理解为一个数据库。

2023-10-11 10:46:42 107

原创 JVM优化

程序的运行必然需要申请内存资源,无效的对象资源如果不及时处理就会一直占有内存资源,最终将导致内存溢出,所以对内存资源的管理是非常重要了。

2023-09-25 16:43:06 118 1

原创 Docker 应用容器

Docker 应用容器的全功能概述

2023-09-07 10:32:23 57

原创 算法题求阶乘

5的阶乘结果有一个0,10的阶乘结果有2个0,求末尾的9位数字,只需要算到39!末尾是9个0,再加对结果没有影响。System.out.print("请输入一个整数:");有一个规律数的阶乘每多5 阶乘结果多一个0。

2023-04-11 17:21:36 107

原创 Vue前端框架

Vue是一套构建用户界面的渐进式前端框架。只关注视图层,并且非常容易学习,还可以很方便的与其它库或已有项目整合。通过尽可能简单的API来实现响应数据的绑定和组合的视图组件。特点 易用:在有HTMLCSSJavaScript的基础上,快速上手。灵活:简单小巧的核心,渐进式技术栈,足以应付任何规模的应用。性能:20kbmin+gzip运行大小、超快虚拟DOM、最省心的优化。Vue核心对象:每个Vue程序都是从一个Vue核心对象开始的选项列表;})选项列表el选项:用于接收获取到页面中的元素。

2023-03-29 22:02:45 433

原创 JavaScript js 基础学习,页面优化

JavaScript js 基础学习,页面优化(内容包括入门安装和详细介绍。)

2023-03-17 14:21:46 112

原创 MyBatis高级

MyBatis高级

2023-03-14 20:51:25 60

原创 MyBtais基本使用

MyBatis基础运用

2023-03-13 20:19:14 85

原创 MySQL高级

mysql高级

2023-03-06 19:09:12 69

原创 MySQL进阶

mysql进阶。

2023-03-02 16:56:00 54

原创 linux与本地互传:

实现本地与Linux服务器文件互传的常用方式:scp命令、lrzsz程序

2023-02-28 21:38:20 1087

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除