- 博客(23)
- 收藏
- 关注
原创 交换机远程登录
查看当前交换机配置情况,输入命令"show running-config”交换机要和主机通信需要配置IP地址,IP地址必须在同一网段内。修改主机名,输入hostname 后面跟着要修改的名字。IP地址不能直接配到交换机上,地址必须配置在。交换机三层VLAN接口上,交换机配置VLAN。输入命令vlan 10设置vlan端口为10。“#” 特权模式,输入命令enable切换。“查看特权模式下可以使用的命令。配置交换机,使之能够与PC通信。进入到vlan 10 配置模式。“查看可以使用的命令。
2025-03-23 19:43:23
136
原创 同一子网通信
主机A通过子网掩码判断主机B的IP地址是否属于同一子网。若在同一子网,主机A需要通过ARP获取主机B的MAC地址。网络地址=IP地址 & 子网掩码10.0.0.1。
2025-03-16 21:20:25
916
原创 传输层知识要点
在这一过程中,传输层(使用 TCP 协议)会确保从你的计算机(源主机)到服务器(目的主机)之间的数据可靠传输。区分不同的应用程序:一台计算机可以同时运行多个应用程序(如 Web 服务器、邮件客户端、文件传输应用等)。UDP(User Datagram Protocol,用户数据报协议)是一种无连接的、不可靠的传输层协议。UDP工作原理是通过无连接的方式将数据包直接发送到目标主机,不保证数据传输的可靠性、顺序或重传,适用于对延迟要求高、丢包可容忍的应用场景。确保数据的可靠传输、流量控制和错误校验。
2024-12-29 21:00:11
596
原创 数据链路层知识要点
通过 VLAN,可以将一个大的网络划分为多个小的逻辑网络,每个 VLAN 就像是一个独立的局域网,不同 VLAN 之间的广播流量不会相互干扰。双方先约定一个生成多项式,发送方根据该多项式对数据进行处理(在数据后添加一定数量的0后除以多项式求余数作为校验码并附在数据后发送),接收方收到数据后同样用该多项式进行计算,若余数为0则认为数据无差错,否则认为有差错。发送方可以连续发送多个数据帧,接收方按序接收,一旦发现某帧出错,接收方会丢弃该帧及其之后的所有帧,发送方则要从出错帧开始重传已发送过的N个帧。
2024-12-29 15:53:28
833
原创 物理层知识要点
为了实现两台主机可以传输比特流,需要考虑以下问题1.两台计算机连接,采用怎样的传输介质?(例如,铜线、光纤等)2.如何用电磁等信号表示“1”或“0”,即如何编码?3.用什么拓扑结构将设备连接成网络?(例如,总线型,星型,网状型等)4.考虑是串型传输还是并型传输,以及两台设备之间的传输方向等5.采用怎样的物理接口进行连接?
2024-12-24 22:26:40
1127
1
原创 Vue3+node.js实现登录
创建文件夹router,在router目录下创建path.js文件。前端跨域,在vite.config.js中添加跨域请求。后端跨域,创建app.js,导入路由。
2024-11-28 18:37:40
398
原创 使用spark中dom4j解析xml文件【scala版】
dom4j 是一个用于 Java 的开源 XML 解析库,主要用于读取、写入、操作 XML 文档。1.可以在不同应用程序之间的通信。2.可以在不同平台之间的通信。3.可以在不同平台之间的数据共享。
2024-10-10 12:16:38
429
原创 【模型选择与优化】交叉验证和网格搜索
将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中,一份作为验证集。然后经过4次测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果为什么需要交叉验证交叉验证的目的:为了让从训练得到模型结果更加准确问题:那么这个只是对于参数得出更好的结果,那么怎么选择或者调优参数呢?
2024-10-10 10:06:22
1106
原创 为何选择 HBase?大数据存储与处理的卓越之选
传统的关系型数据库以及 Hadoop 在存储和处理大规模数据时均显现出一定的局限性。一方面,Hadoop 主要用于实现批量数据处理,且以顺序方式对数据进行访问。另一方面,在 Hadoop 中查找数据时需对整个数据集进行搜索,若要进行随机读取数据,其效率相对较低。
2024-10-07 22:54:39
918
原创 Hudi相关核心概念【时间线、索引...】
(1)元数据:.hoodie目录对应着表的元数据信息,包括表的版本管理(Timeline)、归档目录(存放过时的instant也就是版本),一个instant记录了一次提交(commit)的行为、时间戳和状态,Hudi以时间轴的形式维护了在数据集上执行的所有操作的元数据;(2)数据:和hive一样,以分区方式存放数据;(3)如果有小的 base file 文件,merge base file,生成新的 FileSlice + base file,否则直接写新的 FileSlice + base file。
2024-10-05 20:09:38
1765
原创 《从零起步,开启 Hudi 大数据魔法之旅》
随着大数据的迅猛发展,企业在数据处理和存储方面面临着越来越多的挑战。Apache Hudi(Hadoop Upserts Deletes and Incrementals)作为一个现代化的大数据框架,旨在解决这些挑战,提供高效的数据湖解决方案。本文将介绍Hudi的基本概念、核心特性以及使用场景。Hudi是一个开源的分布式数据湖框架,主要用于管理和存储大规模数据集。它允许用户在数据湖中进行高效的增量数据更新、删除和查询,同时保持良好的读写性能。
2024-10-03 21:45:41
2726
1
原创 随机森林算法中的 “随机” 和 “森林” 这两个重要含义
在数据科学的繁茂森林中,随机森林犹如一片独特的绿洲,它不仅以其独特的算法魅力吸引着无数研究者,更以卓越的泛化能力和稳定性,在众多机器学习模型中独树一帜。今天,就让我们一起探索随机森林的奥秘,解码“随机”与“森林”的双重含义,见证数据科学中的一抹绿色奇迹。“随机”是随机森林的核心灵魂,它在两个层面展现其独特魅力:随机选取样本:随机选取特征:“森林”很好理解,就是由许多棵决策树组成的集合。为什么是森林:森林的作用:
2024-09-26 20:41:54
607
原创 零基础学习机器学习【第五天】“朴素贝叶斯算法”的实现和应用
朴素贝叶斯算法是一种基于概率的分类算法。朴素就是假设特征与特征之间是相互独立,贝叶斯则为贝叶斯公式。它的核心思想是通过已知的特征和类别信息,计算新样本属于不同类别的概率,从而将新样本分类到概率最大的类别中。该算法基于贝叶斯定理,并假设数据集中的特征是相互独立的,这一假设虽然在现实中往往不成立,但简化了计算过程,使得算法在实际应用中仍具有很好的表现。核心思想:朴素贝叶斯算法 = 朴素 + 贝叶斯;旨通过概率对新样本进行分类朴素贝叶斯算法优点算法简单高效对小规模数据表现良好对缺失数据不敏感。
2024-09-26 16:17:01
371
原创 零基础学习机器学习【第四天】KNN算法(K-近邻算法) 实现与应用
它是一种属于监督学习算法中的分类和回归算法,简单来说,就是通过判断与待分类样本最邻近的已知类别样本的类别,来确定待分类样本的类别。举个例子,假设有一组已知类别标签的训练样本集,当我们要对一个新的未知样本进行分类时,KNN 算法会计算这个新样本与训练集中所有样本的距离。这里的距离可以采用多种度量方式,比如欧氏距离、曼哈顿距离等。然后,选取距离最近的 K 个样本。最后,根据这 K 个样本的类别,通过投票等方式来确定新样本的类别。如果这 K 个样本中大多数属于某个类别,那么新样本就被判定为这个类别。
2024-09-25 15:40:33
2003
原创 零基础学习机器学习【第三天】为什么要进行特征工程?
在数据科学的世界里,有一句话广为流传:“数据决定模型的上限,而特征工程决定你离这个上限有多近。”这句话道出了特征工程在机器学习和数据分析中的重要性。那么,什么是特征工程?为什么它如此关键?本文将带你一探究竟。特征工程是指从原始数据中提取、选择和转换特征的过程,目的是为了提高机器学习模型的性能。特征可以是数据的任何属性或变量,例如数值型特征(如年龄、收入)、分类型特征(如性别、颜色)、文本特征(如新闻文章的内容)、图像特征(如图片的颜色、纹理)等。
2024-09-24 21:18:42
1289
原创 零基础学习机器学习【第二天】获取数据集
机器学习就是从数据中发现规律,机器学习分为有监督学习和无监督学习,列举常见的算法。并讲述数据集由特征值和目标值组成。机器学习的前提是要有数据作为支撑。本文主要介绍如何获取数据集。
2024-09-23 12:52:02
1121
原创 零基础学习机器学习【第一天】
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。
2024-09-22 21:33:16
1040
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人