自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 资源 (2)
  • 收藏
  • 关注

原创 吴恩达机器学习笔记(11)—聚类算法

该内容聚焦无监督学习中的聚类算法,核心讲解K-均值算法,还涉及相关辅助知识。聚类针对无标签数据,按内在结构划分成簇,可用于市场分割、社交网络分析等场景;K-均值需先随机选K个聚类中心(K小于样本数),再迭代执行“将样本归到最近中心”“更新中心为簇均值”步骤,直至中心稳定,目标是最小化样本与所属中心的距离和(代价函数);选簇数K常用肘部法则(看K-代价曲线的平缓拐点),为避免局部最优需多次随机初始化,同时有闵可夫斯基距离等相似度计算方法、均一性等聚类衡量指标作辅助。

2025-10-17 16:33:52 647

原创 吴恩达机器学习笔记(10)—支持向量机

本文介绍了支持向量机(SVM)的核心思想及其优化目标。SVM通过"间隔最大化"来寻找最优决策边界,相比逻辑回归更具鲁棒性。文章首先通过线性可分二分类问题直观展示不同决策边界的差异,指出较大的间隔能提高模型泛化能力。随后推导SVM的优化目标,采用折页损失函数替代逻辑回归的sigmoid函数,并引入正则化参数C控制模型复杂度。从几何角度分析,SVM通过最小化参数向量的范数同时最大化样本投影长度,实现大间隔分类。文中还讨论了硬间隔与软间隔的适用场景,指出需平衡C值以避免过拟合或欠拟合。

2025-10-03 20:15:01 1044

原创 吴恩达机器学习笔记(1)—引言

机器学习作为人工智能的核心技术,已广泛应用于医疗、工程、计算生物学等领域,通过算法让计算机从数据中自主学习,其核心算法主要包括监督学习和无监督学习。

2025-10-02 14:39:19 886

原创 吴恩达机器学习笔记(2)—单变量线性回归(附代码)

本文介绍了监督学习中的线性回归算法及其完整流程。以预测房价为例,通过构建单变量线性模型(假设函数h)来拟合训练数据,并使用平方误差代价函数J衡量预测准确性。重点讲解了梯度下降法的原理:通过调整参数θ0和θ1(学习率α控制步长,导数项决定方向)来最小化代价函数。文章还展示了代价函数在不同参数下的可视化表现(3D曲面和等高线图),并强调批量梯度下降的同步更新特性。最终指出该方法能有效找到最优解,适用于大规模数据场景,相比正规方程更具优势。

2025-10-02 14:12:52 926

原创 吴恩达机器学习笔记(3)—线性代数回顾(可选)

本文系统梳理了线性代数核心概念。主要内容包括:1)矩阵和向量的定义及索引方式;2)矩阵加法和标量乘法的运算规则;3)矩阵向量乘法的计算方法和应用场景;4)矩阵乘法的特性及在预测模型中的应用;5)单位矩阵的性质;6)矩阵的逆和转置运算。文章特别强调了这些运算在机器学习(如线性回归)中的实际应用价值,通过房价预测等实例展示了矩阵运算如何简化计算流程、提高计算效率。

2025-09-21 20:58:41 845

原创 吴恩达机器学习笔记(4)—多变量线性回归:梯度下降(附代码)

本文介绍了多变量线性回归模型及其应用。主要内容包括:1. 多变量模型构建,引入特征矩阵和参数向量表示;2. 多变量梯度下降算法原理及数学推导;3. 特征缩放方法和均值归一化技巧;4. 学习率选择策略及收敛性判断;5. 特征工程和多项式回归应用;6. 通过Python代码实现房价预测案例,展示了数据标准化、梯度下降实现及结果可视化过程。文章系统讲解了从理论到实践的多变量回归分析方法,重点强调了特征处理、参数优化等关键技术。

2025-09-21 16:04:18 600

原创 吴恩达机器学习笔记(4)—多变量线性回归:正规方程(附代码)

本文介绍了线性回归中正规方程的求解方法及其与梯度下降算法的比较。正规方程利用矩阵运算直接求解参数最优解,避免了梯度下降的迭代过程。文章详细推导了正规方程的数学原理,包括偏导求解和矩阵运算过程,并分析了其计算复杂度(O(n³))。对比梯度下降,正规方程在小规模数据(n<10000)下更高效,但仅适用于线性模型。最后通过Python代码演示实现,并讨论了矩阵不可逆时的处理方法(伪逆矩阵或特征处理)。结果表明正规方程能快速获得与梯度下降相当精度的解。

2025-09-21 15:24:42 978

原创 吴恩达机器学习笔记(5)—逻辑回归(附代码)

本文介绍了逻辑回归在分类问题中的应用。与线性回归不同,逻辑回归通过sigmoid函数将输出限制在(0,1)区间,适用于预测离散类别。文章详细阐述了决策边界、代价函数(二元交叉熵)的推导过程,以及梯度下降优化方法。通过实例展示了数据预处理、模型训练和决策边界绘制的完整流程,并讨论了多分类问题的一对余处理方法。逻辑回归因其模型简单、解释性强,成为机器学习中重要的基础分类算法。

2025-09-20 20:10:58 1078

原创 Flink的介绍及应用

Flink 是一种开源的分布式计算框架,专为处理大规模数据流而设计。它能够在低延迟和高吞吐的场景下高效地处理实时和批量数据。Flink 的全称是 Apache Flink,它是 Apache 软件基金会的顶级项目之一。

2025-09-18 20:21:17 943

原创 鲁老师深度学习笔记(1)—最大似然估计

本文介绍了最大似然估计方法及其在机器学习中的应用。最大似然估计通过寻找使观测数据发生概率最大的参数来优化模型,其核心是构建似然函数。文章以硬币抛掷为例,对比了概率与似然的概念差异,并推导了线性回归的最大似然估计过程,展示了其与最小二乘法的等价性。最大似然估计具有普遍适用性,是逻辑回归、深度神经网络等模型的基础参数估计方法。该方法通过最大化数据发生的概率,使统计模型与真实数据最相似,为机器学习提供了重要的参数优化框架。

2025-09-18 20:18:00 1116

原创 L2正则化对权重的影响

L2正则化通过平方惩罚特性对高阶项权重施加更强约束。由于高阶项对模型输出更敏感,其权重在训练中容易过度增大导致过拟合。L2惩罚项与权重的平方成正比,使大权重的高阶项承受远高于低阶项的惩罚力度(如5倍权重差异导致25倍惩罚差异)。在梯度下降过程中,高阶项权重的衰减压力也更大,最终迫使高阶项权重更显著地缩小,从而有效抑制过拟合。L2正则化并非直接针对高阶项,而是其数学特性与高阶项的风险特征自然形成协同作用。

2025-09-17 16:57:24 726

原创 吴恩达机器学习笔记(6)—正则化(附代码)

本文系统探讨了机器学习中的过拟合问题及其解决方法。首先分析了过拟合与欠拟合的区别,指出过拟合表现为高方差、对输入敏感,而欠拟合则是高偏差。针对过拟合,提出了三个层面的解决方案:模型层面(正则化、Dropout等)、特征层面(特征筛选、降维)和数据层面(数据增强)。重点讨论了正则化方法,详细介绍了L1/L2正则化的数学原理及在线性回归、逻辑回归中的应用。最后通过代码示例展示了正则化参数λ对决策边界的影响,验证了正则化的实际效果。

2025-09-17 15:33:54 1186

原创 吴恩达机器学习笔记(9)—机器学习应用的建议和系统的设计

本文介绍了机器学习模型评估与优化的常用方法。首先强调数据集应划分为训练集、验证集和测试集(通常6:2:2比例),以正确评估模型泛化能力。通过分析高偏差(欠拟合)与高方差(过拟合)现象,结合学习曲线判断模型问题:高偏差时需增加特征或模型复杂度,高方差时需正则化或增加数据量。对于神经网络,可通过调整层数和宽度来优化。针对类偏斜问题,提出精确率和召回率指标及F1-score综合评估方法,并利用PR曲线进行模型比较。文末指出误差分析的重要性,建议快速构建初始模型指导后续优化方向。

2025-09-16 16:19:01 1095

原创 吴恩达机器学习笔记(7)—神经网络:表示(附代码)

本文介绍了神经网络在处理复杂非线性假设问题上的优势。传统线性模型在特征过多时计算负荷大,而神经网络通过多层神经元连接能有效解决这一问题。文章详细阐述了神经网络的模型表示、激活函数选择(如sigmoid函数)、以及其与逻辑门的关系。特别说明了神经网络如何通过层级结构实现更复杂的特征表达,并用多分类手写数字识别案例展示了实际应用效果,最终达到了97.5%的准确率。

2025-09-14 19:58:56 735

原创 吴恩达机器学习笔记(8)—神经网络:反向传播算法(附代码)

本文介绍了神经网络中的代价函数和反向传播算法。首先定义了符号系统,包括各层神经元、权重矩阵等。对于多分类问题,使用交叉熵代价函数,因其在sigmoid激活下收敛更快。反向传播算法通过计算误差项δ从输出层向前逐层传播,利用链式法则求梯度。推导过程包括输出层和隐藏层误差的计算公式,最终给出反向传播步骤:初始化Δ矩阵,遍历数据集进行前向传播和误差反向传播,累加梯度并加入正则化项。该方法高效计算梯度,解决了深层网络参数训练问题。

2025-09-10 21:01:30 371

原创 PyCharm连接WSL2搭建的Python开发环境

使用 PyCharm 连接 WSL2 搭建 Python 开发环境的主要目的是结合 Windows 的易用性和 Linux 的开发优势,提升开发效率和体验。

2025-05-07 11:49:40 3816 2

原创 Oracle数据库迁移到MySQL数据库

记录oracle数据库迁移到mysql数据库的过程,供以后参考。

2025-02-25 17:11:45 2583

原创 基于WSL2上的Docker部署DeepSeek镜像,亲测可用

同时,有观点认为,DeepSeek可能遭受了大规模的恶意网络攻击,如分布式拒绝服务攻击(DDoS),进一步加剧了服务器的负担,影响正常运行。这不仅能够快速启动服务,还能有效解决不同操作系统之间的兼容性问题,采用隔离环境的方式,避免了因环境差异导致的问题。这里我们不分别安装两次了,我们使用官方提供了的方法,一个镜像包括了 open webui 与 ollama3,更加方便。注意:这是您需要安装的唯一驱动程序。迅速走红,成为全球科技圈的焦点,不仅让科技圈沸腾,更让普通人看到了AI技术带来的无限可能。

2025-02-13 11:03:28 2056

原创 保姆级教程Docker部署Zookeeper模式的Kafka镜像

为了简化安装过程并确保环境一致性,推荐使用 Docker 来本地部署 Kafka。这不仅能够快速启动服务,还能有效解决不同操作系统之间的兼容性问题,采用隔离环境的方式,避免了因环境差异导致的问题。

2025-02-09 17:36:43 2869

原创 保姆级教程Docker部署KRaft模式的Kafka官方镜像

本文以 KRaft 模式为例,介绍了使用 Docker 部署 Kafka 单机或集群的方法,包括拉取镜像、配置方式、单节点部署、集群部署,以及可视化工具的部署。

2025-02-04 20:53:19 7651 13

原创 保姆级教程Docker部署Zookeeper镜像

本文介绍了如何在 Docker 容器中部署 Zookeeper,包括创建宿主机挂载目录、拉取镜像、配置容器启动参数,并通过 Docker Compose 简化启动过程。

2025-02-04 17:16:54 2405

原创 ClickHouse实现大数据准实时更新

本文介绍了使用 ClickHouse 处理大数据的两种准实时更新方案。由于传统数据库性能不足,ClickHouse 提供高效查询,适合大数据分析。第一种方案采用 ReplacingMergeTree 引擎,结合 optimize final 强制数据合并,实现批量更新,减少频繁更新对性能的影响,但合并操作消耗资源。第二种方案使用 argMax 函数,按最大更新时间聚合数据,确保实时返回最新记录。该方案适用于高吞吐量和实时更新,但查询复杂度和内存消耗较高。

2025-01-13 18:00:22 2134

原创 node-sass离线安装

在使用npm install安装node_modules依赖,经常会遇到node-sass安装失败的问题,这个时候就需要采用离线安装。

2025-01-12 19:26:37 1393

原创 时序数据库InfluxDB—介绍与性能测试

在一个RP中,如果指定的保留时间为24小时,那么每个shard的duration为1小时,即每个shard的时间跨度为1小时,那么总共会有24个跨度为1小时的shard,在触发数据的RP后,删除最早时间跨度的shard。另外一种就是合并当前的 tsm 文件,将多个小的 tsm 文件合并成一个,使每一个文件尽量达到单个文件的最大大小,减少文件的数量,并且一些数据的删除操作也是在这个时候完成。这里定义的InfluxDB的负载是基于每秒的写入的数据量、每秒查询的次数以及唯一series的数目。

2025-01-09 15:43:04 2503

原创 保姆级教程Docker部署MySQL镜像

本文介绍了如何在 Docker 中安装和配置 MySQL 容器,涵盖了创建挂载目录、编写配置文件、使用 docker run 和 Docker Compose 启动容器的步骤。

2025-01-05 12:19:25 1857

原创 保姆级教程Docker部署ClickHouse镜像

本文介绍了在Docker部署ClickHouse镜像的详细步骤

2024-12-30 21:05:12 3761

原创 达梦数据库迁移到MySQL字段注释缺失问题处理

本文介绍达梦数据库迁移到MySQL后,字段注释缺失问题的处理方案。

2024-12-25 10:38:50 1006

原创 达梦数据库redo日志损坏,报错[-723]故障处理

本文介绍达梦数据库的redo 日志损坏,报[-723]错误的故障解决方案

2024-12-22 13:13:29 868

原创 保姆级教程Docker部署RabbitMQ镜像

本文介绍了如何在 Docker 容器中部署 RabbitMQ,包括创建宿主机挂载目录、拉取镜像、配置容器启动参数,并通过 Docker Compose 简化启动过程。

2024-12-21 16:11:06 1889

原创 利用notepad++删除特定关键字所在的行

本文指导如何在Notepad++的搜索功能中,利用Ctrl+H快捷键打开正则表达式模式,查找包含关键字的内容,选择是否保留空行,并进行替换操作,附带配置界面示例。

2024-12-17 14:03:32 4494

原创 使用Nexus3搭建npm私有仓库

npm的全称是Node Package Manager,它是一个开放源代码的命令行工具,用于安装、更新和管理Node.js模块。本文介绍通过nexus3搭建npm私有仓库,可以减少从公共npm仓库下载的时间,从而加速构建速度‌,并且可以更好地管理和控制其内部开发的npm包。

2024-12-13 16:30:55 1688

原创 Docker容器运行常用参数详解

在Docker中运行一个容器需要使用docker run命令,这个命令后面可以跟很多参数来定制容器的行为。本文对常用的容器运行参数进行详解。

2024-12-09 21:01:05 1277

原创 保姆级教程Docker部署Nacos镜像

本文介绍了如何在 Docker 中部署 Nacos 容器,包括创建宿主机配置目录、拉取镜像、复制配置文件、在 MySQL 中创建数据库表、修改配置启用鉴权功能,并通过 Docker Compose 启动容器。

2024-12-08 19:06:29 2249

原创 保姆级教程Docker部署MinIO镜像

本文介绍了如何通过 Docker 部署 MinIO。包括创建挂载目录、拉取 MinIO 镜像、配置并启动容器、使用 Docker Compose 简化启动过程,以及访问 MinIO 控制台查看运行状态。提供了详细的命令和配置文件,帮助用户快速搭建 MinIO 服务。

2024-12-07 17:21:54 2229

原创 保姆级教程Docker部署Redis镜像

本文介绍了通过 Docker 部署 Redis的方法,包括创建配置文件目录、拉取镜像并启动容器。同时,通过 Docker Compose 提供了便捷的容器管理方式,简化 Redis 的部署与运行。

2024-12-07 13:27:48 2228

原创 基于Huffman编码的GPS定位数据无损压缩算法

霍夫曼在1952年提出了霍夫曼编码,又称Huffman编码。Huffman编码是无损压缩的编码,压缩后的文件重新解码后与源文件数据保持一致。本文针对GPS数据格式的特点,在数据预处理的基础上,提出了采用Huffman编码的方法对GPS定位数据进行压缩。该算法与目前现有的GPS定位数据压缩算法比较,程序量小,压缩比大,且易于实现。对解决车载GPS系统中数据量大而存储器资源有限的问题,以及数据传输的瓶颈问题具有重要的实际意义。

2024-12-06 17:20:14 1232

原创 使用Nexus3搭建Maven私有镜像仓库

Maven‌是一个项目管理工具,主要用于构件管理和依赖管理。Nexus‌是一个强大的Maven仓库管理器,通常被称为Maven的私服。本文详细介绍了Maven和Nexus的部署和配置。

2024-12-05 21:18:37 3536

原创 WSL2中安装Docker—部署Docker Engine方案

在WSL2中安装Docker主要有以下两种常见的方法:使用Docker Desktop for Windows(配置WSL2作为后端)和直接在WSL2中安装Docker Engine。本文详细介绍如何在WSL2中安装Docker Engine,并探讨这种方法相对于使用Docker Desktop的优势和注意事项。

2024-11-30 21:11:57 7806

原创 Ubuntu上安装 Docker及可视化管理工具

Docker是一个开源的应用容器引擎,使用容器化技术将软件应用及其依赖包装在一个可移植的环境中,以便在任何支持Docker的平台上运行。Portainer是一个开源的Web UI工具,用于管理和监控Docker容器。它提供了一个直观的图形界面,方便用户查看和管理Docker容器,包括容器列表、容器日志、容器配置等。本文详细介绍Docker和Portainer的安装步骤。

2024-11-30 21:01:07 16311 4

原创 SpringBoot读取properties中文乱码解决方案

在SpringBoot开发中,我们经常会使用properies文件来配置项目的各种参数,包括中文字符,然而有时候我们会遇到properies文件中的中文字符在读取时出现乱码的情况。这种问题可能影响到我们项目的正常运行,因此需要及时解决。本文将介绍如何解决SpringBoot读取properies中文乱码问题,并提供相应的代码示例。

2024-11-26 22:18:20 2500

基于Springboot的office文件处理服务组件

包含以下服务: 1、基于JXLS实现excel动态图表模板导出功能 2、基于Freemarker实现word模板导出功能 3、基于OpenOffice实现word转pdf功能 4、基于itextpdf实现pdf添加水印功能

2024-11-17

基于Huffman编码的GPS定位数据无损压缩算法

本文针对GPS数据格式的特点,在数据预处理的基础上,提出了采用Huffman编码的方法对GPS定位数据进行压缩。针对csv格式的定位数据进行压缩,压缩率可达15%。该算法与目前现有的GPS定位数据压缩算法比较,程序量小,压缩比大,且易于实现。对解决车载GPS系统中数据量大而存储器资源有限的问题,以及数据传输的瓶颈问题具有重要的实际意义。

2024-12-16

usb口转串口,安装后可以读串口的方式读取usb口

usb口转串口,安装后可以读串口的方式读取usb口,方便usb设备读取,有两个版本,一个xp,一个vista

2017-11-25

c#桥接mysql数据库

亲测可适用于mysql 5.1,vs2010中直接引用 %program files(x86)%/MySQL Connector Net 6.7.9\Assemblies\v4.0\ 下的MySql.Data.dll 即可

2017-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除