- 博客(43)
- 收藏
- 关注
原创 机器学习03-色彩空间:RGB、HSV、HLS
RGB、HSV和HLS色彩空间各有优缺点,适用于不同的机器学习和计算机视觉任务。RGB色彩空间直观且易于理解,适合图像显示和基础处理;HSV和HLS色彩空间将颜色信息和亮度信息分离,更适合颜色提取、图像增强和分析等任务。在实际应用中,可以根据具体需求选择合适的色彩空间,并利用颜色空间转换来实现不同的图像处理目标。
2025-05-31 15:55:25
447
原创 机器学习12-上采样与下采样
下采样是指从多数类中随机移除一部分样本,使得多数类和少数类的样本数量达到平衡或接近平衡的状态。上采样是指通过某种方式增加少数类的样本数量,使其与多数类的样本数量达到平衡或接近平衡。上采样和下采样是解决类别不平衡问题的两种重要方法。它们各有优缺点,在实际应用中需要根据数据集的特点和模型的需求进行选择。在实际操作中,也可以尝试结合使用这两种方法,以达到更好的效果。
2025-05-31 15:53:17
187
原创 机器学习10-随机森林
随机森林作为一种强大的集成学习算法,在机器学习领域有着广泛的应用。它通过构建多棵决策树并综合其预测结果,有效地提高了模型的准确性和稳定性。在实际应用中,我们可以根据具体问题的特点和需求,合理调整随机森林的参数,以获得更好的模型性能。未来,随着数据量的不断增大和计算能力的提升,随机森林有望在更多领域发挥更大的作用。
2025-05-20 23:43:11
1544
原创 机器学习09-正规方程
正规方程是解决线性回归问题的一种有效方法,尤其适用于特征数量较少的情况。然而,在处理大规模数据集或特征数量众多的情况时,其计算和存储的开销可能变得不可接受,此时应考虑使用更高效的优化算法,如梯度下降。
2025-05-18 19:05:09
478
原创 机器学习08-损失函数
在机器学习中,损失函数(Loss Function)是一个衡量模型预测值与真实值之间差异的函数。它的主要作用是为模型提供一个优化的方向,通过最小化损失函数的值,使模型能够更好地拟合训练数据,从而提高模型的性能。损失函数是机器学习中的一个重要概念,它直接影响模型的训练效果和性能。根据不同的任务类型和数据特性,选择合适的损失函数,并结合有效的优化算法,可以更好地训练出性能优良的模型。在实际应用中,还需要根据具体问题不断调整和优化损失函数,以达到最佳的模型效果。
2025-05-15 21:41:52
848
原创 机器学习07-归一化与标准化
选择依据如果数据的量纲不同,且数值范围差异较大,可以选择归一化。如果数据服从正态分布或近似正态分布,且模型对数据分布有特定要求,可以选择标准化。对于基于距离的模型,如KNN、K-Means等,归一化通常更合适;对于基于梯度下降的优化算法,如线性回归、逻辑回归等,标准化通常更有效。注意事项在进行归一化或标准化时,需要保存归一化或标准化的参数(如最小值、最大值、均值、标准差等),以便在对新数据进行预处理时使用相同的参数。
2025-05-13 23:14:44
832
原创 机器学习06-RNN
RNN 及其变体在序列建模领域具有重要的地位和广泛的应用。尽管存在一些训练难点和局限性,但通过不断的研究和改进,如优化训练算法、设计更有效的网络结构等,RNN 的性能和适用范围得到了不断提升。随着深度学习技术的不断发展,相信 RNN 将在更多领域发挥更大的作用,并与其他技术相结合,为解决复杂的序列问题提供更强大的工具。
2025-04-22 23:08:37
1104
原创 机器学习05-CNN
CNN 在图像处理领域展现了强大的性能,但其应用也存在一些局限,如对数据量要求较高、模型结构复杂导致计算资源消耗大等。未来,随着硬件技术的不断发展和新算法的提出,如更高效的网络架构搜索方法、更精准的特征提取技术等,CNN 将在更多领域发挥更大的作用,为人工智能的发展提供更有力的支持。同时,研究人员也在探索如何将 CNN 与其他技术(如生成对抗网络、Transformer 等)相结合,以进一步提升模型的性能和泛化能力。
2025-04-18 22:31:47
1196
原创 yolov8复现
安装pytorch前需安装cuda。通过“nvidia - smi”命令查看显卡支持的CUDA最高版本,若版本不足需更新显卡驱动。在NVIDIA Developer官网或提供的网盘链接下载匹配版本的cuda,安装时建议选默认路径,安装过程中选择自定义安装并全选组件。安装完成后用“nvcc - V”命令检查是否安装成功。之后,进入cudnn官网,下载与cuda版本匹配的cudnn Windows版本压缩包,解压后将里面的三个文件夹内容复制到cuda的安装目录下进行覆盖替换。
2025-04-17 22:53:54
868
原创 机器学习03——K近邻
KNN算法是一种简单而有效的机器学习算法,适用于分类和回归任务。它基于数据点之间的距离进行预测,具有简单易实现、对数据适应性强等优点,但也存在计算效率低、存储要求高等缺点。在实际应用中,需要根据数据的特点和任务需求选择合适的K值和距离度量方式,并对数据进行预处理,以提高算法的性能。
2025-04-16 14:46:04
707
1
原创 机器学习01
机器学习是人工智能的一个重要分支,它使计算机系统能够基于数据自动学习和改进。其核心是让机器通过算法从大量数据中发现规律和模式,从而在新的数据上做出准确的预测或决策。例如,垃圾邮件过滤器通过学习已标记的邮件数据,识别出垃圾邮件的特征,进而自动过滤新的垃圾邮件。
2025-03-25 20:27:56
824
原创 U-NET代码复现第一天
选择train.hq和train.mask进行下载,下载时会跳到rules,滑到最下面点击确定进行身份认证即可,下载速度比较慢。进入网站选择与cuda版本对应的cuda安装,我安装的是2.0.0,cuda 11.8版本。imges图像里混入了一张mask图像,解决方法:删除即可。注册时会遇到无法输入验证码的问题,可以参考以下文章解决。选择合适自己的cuda版本下载,不超过电脑配置即可。然后按照相应博客教程一步步安装。我下载的是12.3版本。2.安装pytorch。
2025-03-21 21:27:16
327
原创 初识机器学习
这里不需要进行特别的数据预处理,因为是用随机生成数据来演示。# 假设有一个销售数据集,包括销售额和其他相关特征。# 这里用随机生成数据来模拟一个简单的例。# 计算均方误差和R平方作为评估指标。# 将数据集划分为训练集和测试集。# 使用测试集对模型进行评估。# 3. 模型选择和训练。# 创建一个线性回归模型。# 2. 数据预处理。
2024-03-29 21:56:28
190
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人