自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hive学习笔记

文章目录前言数据仓库介绍简介为什么使用 Hive一、Hive 架构Hive 架构图Hive 与 Hadoop 的关系Hive 与传统数据库对比二、Hive SQL数据类型分隔符总结前言数据仓库介绍数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。数仓专注分析数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统;同时数据仓库自

2022-05-11 11:05:13 304

原创 Hadoop学习笔记

文章目录前言一、Hadoop集群整体概述二、启动三、HDFS分布式文件系统基础数据元数据场景互动:分布式存储系统的核心属性及功能含义四、HDFSHDFS设计目标重要特性五、HDFS Shell操作常用操作六、HDFS集群角色与职责官方架构图总结前言提示:部分内容总结自https://www.bilibili.com/video/BV1CU4y1N7Sh?p=27&spm_id_from=pageDriver,仅供学习Apache™ Hadoop® 是一个开源的, 可靠的(reliabl

2022-05-09 17:54:14 250

原创 Linux学习笔记

提示:新手记忆笔记,大佬勿看文章目录前言一、文件系统特殊符号二、常用操作命令1.pwd2.读入数据总结前言Linux有上百种不同的发行版,如基于社区开发的debian、archlinux,和基于商业开发的Red Hat Enterprise Linux、SUSE、Oracle Linux等一、文件系统从/根目录开始,种类分为:目录(directory)、文件(file)。路径具有唯一性。常见概念:当前路径、相对路径(相对当前工作目录开始的路径,随当前路径变化)、绝对路径(不管工作目录,.

2022-05-07 15:17:26 320

原创 ML学习笔记1

机器学习流程分为四步: 1、预处理 2、特征工程 3、机器学习 4、模型评估我们来看看下面两组数据,说说它们的区别?离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所 有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续 的,如,长度、时间、质量值等,这类数据通常是非整数,含有小数部分。注:只要记住一点,离散型是区间内不可分,连续型是区间内可分调参参数:自己调的参数超参数:模型

2022-04-26 22:33:16 1299

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除