自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 VMware上部署Hadoop集群(包括部署前的VMware安装和创建准备、克隆虚拟机、免密登录、JDK的安装、伪分布式部署和完全分布式部署)(新手友好,巨详细)

超级详细的部署Hadoop,包括部署前的所有安装准备,克隆虚拟机、免密登录、JDK的安装、伪分布部署和完全分布式部署

2024-11-23 19:27:08 1720

原创 Excel时间类型函数(包括today、date、eomonth、year、month、day、weekday、weeknum、datedif)

Excel 使用的日期是一个从 1900 年 1 月 1 日开始的序列号,例如:以下是主要函数的详细介绍:用途:返回当前日期,不包含时间部分。示例:用途:返回由年、月、日三个参数构成的日期。示例:用途:返回指定日期 前/后指定月数的月份的最后一天。示例:用途:从给定日期中提取年份。示例:用途:从给定日期中提取月份(1-12)。示例:用途:从给定日期中提取日期中的“日”。示例:用途:返回一个日期对应的 星期几,默认为 到 。示例:用途:返回一个日期在一年中的第几周。示例: 用于计算两个日期之间的差值,并返回

2025-04-02 20:55:42 1155

原创 Excel数据清洗函数(包括left、right、mid、len、lenb、concatenate、text、trim、replace、substitute、find、search)

例如,在对一列数据进行预处理时,你可以先用 TRIM 去掉多余空格,再用 LEFT/MID/RIGHT 提取有效部分,最后用 SUBSTITUTE 或 REPLACE 对错误或不标准的格式进行修正。将 “Hello” 中第 1 个字符开始的 2 个字符 “He” 替换为 “Y”,返回 “Yllo”。:在文本字符串中将某一指定文本替换为新的文本,可选择性地只替换第几次出现的目标文本。:去除文本中多余的空格,仅保留单词之间的单个空格,不删除中间的正常空格。:从文本的最左侧提取指定数量的字符。

2025-03-31 13:34:00 768

原创 参数估计学习笔记通俗易懂版(包括点估计和区间估计(区间估包括总体均值的置信区间(总体标准差未知、总体标准差已知)和总体方差的置信区间))

参数估计学习笔记通俗易懂版(包括点估计和区间估计(区间估包括总体均值的置信区间(总体标准差未知、总体标准差已知)和总体方差的置信区间))

2025-03-21 21:54:34 1056

原创 伯努利分布和二项分布学习笔记

随机变量取值设随机变量XXXX1表示成功(例如“正面”、“合格”等)0表示失败(例如“反面”、“不合格”)X=1, & \text{表示成功(例如“正面”、“合格”等) } \\0, & \text{表示失败(例如“反面”、“不合格”)}X10​表示成功(例如正面合格等)表示失败(例如反面不合格​参数成功的概率记为ppp(其中0≤p≤100≤p≤100≤p≤10),失败的概率则为1−p1−p1−p。设XXX表示n。

2025-03-21 18:07:15 803

原创 中文分词算法(正向最大匹配算法(FMM)、逆向最大匹配算法(RMM)和双向最大匹配算法(BMM))

算法类型扫描方向优点缺点正向最大匹配从左向右实现简单、速度快易产生歧义,依赖词典完整性逆向最大匹配从右向左能在部分情况避免正向匹配的歧义同样依赖词典,部分情况下分词结果也可能不准确双向最大匹配双向对比综合两者优点,结果更合理算法复杂度高,仍受词典质量影响注意:三种算法都依赖于词典,词典不全或质量较低都会影响分词结果。分词过程中的歧义问题往往需要结合上下文或引入统计信息、机器学习方法(如 HMM、CRF)来进一步解决。

2025-03-18 13:51:43 1467

原创 MySQL 进阶学习笔记(包括MySQL的存储引擎、索引、SQL优化、视图、存储过程、触发器、锁InnoDB引擎和MySQL管理)的相关内容详细版

存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表的,而不是基于库的,所以存储引擎也可以被称为表类型。MySQL 支持多种存储引擎,每种引擎适用于不同的应用场景.1. 查询建表语句-- 查询建表语句,默认存储引擎:InnoDBshow create table 表名;-- 结果) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci COMMENT='用户表'

2025-03-17 11:15:34 790

原创 MySQL基础学习笔记,包括(DDL(数据定义语言)、DML(数据操作语言)、DQL(数据查询语言)、DCL(数据控制语言)、函数、约束、多表查询、事务和事务隔离)全是干货

MySQL基础学习笔记,包括(DDL(数据定义语言)、DML(数据操作语言)、DQL(数据查询语言)、DCL(数据控制语言)、函数、约束、多表查询、事务和事务隔离)全是干货。

2025-03-08 14:46:00 988

原创 大数据Hadoop中MapReduce的介绍包括编程模型、工作原理(MapReduce、MapTask、ReduceTask、Shuffle工作原理)

大数据Hadoop中MapReduce的介绍包括编程模型、工作原理(MapReduce、MapTask、ReduceTask、Shuffle工作原理)通俗易懂的学习笔记

2025-01-19 11:25:07 1338

原创 HDFS的Federation机制提高存储能力及读写性能的实现原理和Erasure Coding节省存储空间的原理

本文章主要介绍HDFS的Federation机制的实现原理和Erasure Coding节省存储空间的原理 。

2024-12-09 22:12:00 949

原创 大数据学习案例——使用Java API操作HDFS

通过Java API演示如何操作HDFS分布式文件系统的文件和目录。

2024-12-09 20:54:46 1463

原创 大数据(Hadoop)学习案例—通过Shell脚本定时采集数据到HDFS

在实际的开发环境中,服务器每天都会产生大量的日志文件,这些日志文件会记录服务器的运行状态。当服务器宕机时,可以从日志文件中查找服务器宕机原因,从而尽快让服务器恢复正常运行。这个案例演示如何通过Shell脚本周期性的将Hadoop的日志文件上传到HDFS。

2024-12-09 11:22:24 2405

原创 记录报错:HADOOP_HOME and hadoop.home.dir are unset. -see https://wiki.apache.org/hadoop/WindowsProblems

第一次运行hadoop程序时,报了该错误:java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset. -see https://wiki.apache.org/hadoop/WindowsProblems的解决方案。

2024-12-08 22:11:38 2727 2

原创 大数据学习案例——词频统计

大数据学习案例——词频统计

2024-12-06 23:23:33 748

原创 HDFS的shell操作

HDFS的shell操作(包括查看指定目录信息-ls、查看指定目录下每个文件和子目录的大小-du、移动指定目录或文件-mv、复制指定目录或文件-cp、删除指定目录或文件-rm、)将本地文件系统的文件上传到HDFS指定目录-put、查看指定文件的内容-cat、查看帮助文档-help、创建目录-mkdir、将HDFS的指定文件下载到本地文件系统-ge。本文将对上述HDFS Shell 子命令进行演示和介绍。

2024-12-06 12:32:41 1154

原创 HDFS的读写流程及健壮机制

HDFS的读写流程及健壮机制

2024-11-26 12:31:28 815

原创 HarmonyOS 华为鸿蒙DevEco Studio的下载安装和创建项目教程

HarmonyOS 华为鸿蒙DevEco Studio的下载安装和创建项目教程

2024-11-13 10:36:12 1408

原创 如何在虚拟机上安装MySQL5.7和彻底在虚拟机上删除MySQL5.7(详细版)

​如何在虚拟机上安装MySQL5.7和如何彻底在虚拟机上删除MySQL5.7(详细版)

2024-11-05 12:23:26 2363

原创 还未暂停hadoop就关机后,出现子节点上没有启动任何DataNode和NodeManager进程

还未暂停hadoop就关机后,出现子节点上没有启动任何DataNode和NodeManager进程

2024-11-02 21:11:18 602

原创 操作系统概述

操作系统(分点总结)

2024-10-30 19:07:19 1008

原创 基于完全分布式部署Hadoop(修改环境变量、修改配置文件、格式化HDFS、启动Hadoop、通过WEB UI查看Hadoop的运行状态、关闭防火墙、添加IP映射、安全模式的退出)

Hadoop学习笔记,基于完全分布式部署Hadoop,含参数详解,欢迎阅读,欢迎评论,欢迎指正。

2024-10-27 20:03:42 1328 1

原创 HDFS分布式文件系统的架构及特点

Hadoop学习笔记(独自总结精简版),如若在某个内容上理解有误,欢迎指正,谢谢。

2024-10-26 15:48:06 1004 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除