吹风看太阳-优快云博客

原创机器学习03-色彩空间：RGB、HSV、HLS

RGB、HSV和HLS色彩空间各有优缺点，适用于不同的机器学习和计算机视觉任务。RGB色彩空间直观且易于理解，适合图像显示和基础处理；HSV和HLS色彩空间将颜色信息和亮度信息分离，更适合颜色提取、图像增强和分析等任务。在实际应用中，可以根据具体需求选择合适的色彩空间，并利用颜色空间转换来实现不同的图像处理目标。

2025-05-31 15:55:25 447

原创机器学习12-上采样与下采样

下采样是指从多数类中随机移除一部分样本，使得多数类和少数类的样本数量达到平衡或接近平衡的状态。上采样是指通过某种方式增加少数类的样本数量，使其与多数类的样本数量达到平衡或接近平衡。上采样和下采样是解决类别不平衡问题的两种重要方法。它们各有优缺点，在实际应用中需要根据数据集的特点和模型的需求进行选择。在实际操作中，也可以尝试结合使用这两种方法，以达到更好的效果。

2025-05-31 15:53:17 187

原创机器学习10-随机森林

随机森林作为一种强大的集成学习算法，在机器学习领域有着广泛的应用。它通过构建多棵决策树并综合其预测结果，有效地提高了模型的准确性和稳定性。在实际应用中，我们可以根据具体问题的特点和需求，合理调整随机森林的参数，以获得更好的模型性能。未来，随着数据量的不断增大和计算能力的提升，随机森林有望在更多领域发挥更大的作用。

2025-05-20 23:43:11 1544

原创机器学习09-正规方程

正规方程是解决线性回归问题的一种有效方法，尤其适用于特征数量较少的情况。然而，在处理大规模数据集或特征数量众多的情况时，其计算和存储的开销可能变得不可接受，此时应考虑使用更高效的优化算法，如梯度下降。

2025-05-18 19:05:09 478

在机器学习中，损失函数（Loss Function）是一个衡量模型预测值与真实值之间差异的函数。它的主要作用是为模型提供一个优化的方向，通过最小化损失函数的值，使模型能够更好地拟合训练数据，从而提高模型的性能。损失函数是机器学习中的一个重要概念，它直接影响模型的训练效果和性能。根据不同的任务类型和数据特性，选择合适的损失函数，并结合有效的优化算法，可以更好地训练出性能优良的模型。在实际应用中，还需要根据具体问题不断调整和优化损失函数，以达到最佳的模型效果。

2025-05-15 21:41:52 848

原创机器学习07-归一化与标准化

选择依据如果数据的量纲不同，且数值范围差异较大，可以选择归一化。如果数据服从正态分布或近似正态分布，且模型对数据分布有特定要求，可以选择标准化。对于基于距离的模型，如KNN、K-Means等，归一化通常更合适；对于基于梯度下降的优化算法，如线性回归、逻辑回归等，标准化通常更有效。注意事项在进行归一化或标准化时，需要保存归一化或标准化的参数（如最小值、最大值、均值、标准差等），以便在对新数据进行预处理时使用相同的参数。

2025-05-13 23:14:44 832

原创机器学习06-RNN

RNN 及其变体在序列建模领域具有重要的地位和广泛的应用。尽管存在一些训练难点和局限性，但通过不断的研究和改进，如优化训练算法、设计更有效的网络结构等，RNN 的性能和适用范围得到了不断提升。随着深度学习技术的不断发展，相信 RNN 将在更多领域发挥更大的作用，并与其他技术相结合，为解决复杂的序列问题提供更强大的工具。

2025-04-22 23:08:37 1104

原创机器学习05-CNN

CNN 在图像处理领域展现了强大的性能，但其应用也存在一些局限，如对数据量要求较高、模型结构复杂导致计算资源消耗大等。未来，随着硬件技术的不断发展和新算法的提出，如更高效的网络架构搜索方法、更精准的特征提取技术等，CNN 将在更多领域发挥更大的作用，为人工智能的发展提供更有力的支持。同时，研究人员也在探索如何将 CNN 与其他技术（如生成对抗网络、Transformer 等）相结合，以进一步提升模型的性能和泛化能力。

2025-04-18 22:31:47 1196

原创 yolov8复现

安装pytorch前需安装cuda。通过“nvidia - smi”命令查看显卡支持的CUDA最高版本，若版本不足需更新显卡驱动。在NVIDIA Developer官网或提供的网盘链接下载匹配版本的cuda，安装时建议选默认路径，安装过程中选择自定义安装并全选组件。安装完成后用“nvcc - V”命令检查是否安装成功。之后，进入cudnn官网，下载与cuda版本匹配的cudnn Windows版本压缩包，解压后将里面的三个文件夹内容复制到cuda的安装目录下进行覆盖替换。

2025-04-17 22:53:54 868

原创机器学习03——K近邻

KNN算法是一种简单而有效的机器学习算法，适用于分类和回归任务。它基于数据点之间的距离进行预测，具有简单易实现、对数据适应性强等优点，但也存在计算效率低、存储要求高等缺点。在实际应用中，需要根据数据的特点和任务需求选择合适的K值和距离度量方式，并对数据进行预处理，以提高算法的性能。

2025-04-16 14:46:04 707 1

原创机器学习02——RNN

2025-04-14 20:54:35 1082

原创机器学习01

机器学习是人工智能的一个重要分支，它使计算机系统能够基于数据自动学习和改进。其核心是让机器通过算法从大量数据中发现规律和模式，从而在新的数据上做出准确的预测或决策。例如，垃圾邮件过滤器通过学习已标记的邮件数据，识别出垃圾邮件的特征，进而自动过滤新的垃圾邮件。

2025-03-25 20:27:56 824

原创 nnunet复现

nnunet复现第一天

2025-03-23 21:18:13 289 2

原创 U-NET代码复现第一天

选择train.hq和train.mask进行下载，下载时会跳到rules，滑到最下面点击确定进行身份认证即可，下载速度比较慢。进入网站选择与cuda版本对应的cuda安装，我安装的是2.0.0，cuda 11.8版本。imges图像里混入了一张mask图像，解决方法：删除即可。注册时会遇到无法输入验证码的问题，可以参考以下文章解决。选择合适自己的cuda版本下载，不超过电脑配置即可。然后按照相应博客教程一步步安装。我下载的是12.3版本。2.安装pytorch。

2025-03-21 21:27:16 327

原创初识机器学习

这里不需要进行特别的数据预处理，因为是用随机生成数据来演示。# 假设有一个销售数据集，包括销售额和其他相关特征。# 这里用随机生成数据来模拟一个简单的例。# 计算均方误差和R平方作为评估指标。# 将数据集划分为训练集和测试集。# 使用测试集对模型进行评估。# 3. 模型选择和训练。# 创建一个线性回归模型。# 2. 数据预处理。

2024-03-29 21:56:28 190 1