机器学习
文章平均质量分 88
Vixerunt Yuan
机器学习我休息
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
人工智能系统综合设计——基于电商评论分析的文本情感分析系统
随机森林对非线性特征和高维数据表现良好,BERT 则通过大规模语料预训练,具备强大的语义理解能力,显著提升模型对复杂评论语境的感知能力。为提升模型的泛化能力,系统将预处理后的数据按照 8:1:1 的比例划分为训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)。去除冗余空格和换行符;在本项目中,VSCode 主要用于 Vue 前端开发,配合 ESLint、Vetur、Prettier 等插件,可实现实时语法提示、自动格式化和调试支持,便于前后端协同开发。原创 2025-07-31 11:21:18 · 1308 阅读 · 0 评论 -
机器学习——深度学习的库环境配置
实验目的:本次实验旨在完成深度学习的库环境配置,特别是建立Python开发环境,安装必要的工具和框架,确保开发过程中能顺利进行深度学习模型的开发、训练和测试。成功运行了Jupyter Notebook,并完成了PyTorch的基础示例代码,实现了对深度学习框架的基本操作和理解。通过本次实验,完成了深度学习开发环境的搭建,确保了基础工具和库的安装与使用,为后续的深度学习项目开发奠定了基础。安装过程中的其他依赖冲突:在安装过程中,多个库版本发生冲突,导致安装失败。(二)Python虚拟环境安装。原创 2025-07-31 11:10:06 · 770 阅读 · 0 评论 -
机器学习——使用循环网络的文本情感分析
1.解决方法: 使用 hidden[-2,:,:] 和 hidden[-1,:,:] 拼接,并加 dropout。2.解决方法: 将 batch_size 设置为 32,减小训练负担,同时降低 epoch 数提高实验效率。此外,我们还通过 ids_to_str 函数将数字序列还原为可读的文本,便于调试和理解模型输入内容。1.问题:模型结构报错(维度不一致), 最初在处理 RNN 隐状态拼接时未注意 shape。3.问题:准确率震荡, dropout比例较高,影响模型稳定性。原创 2025-07-31 11:04:20 · 633 阅读 · 0 评论 -
机器学习——使用卷积神经网络的图像分类识别
最后,使用全连接层进行分类。- 第1层:卷积层(输入 3 通道,输出 32 通道,卷积核大小 3,步幅 1,零填充 1)→ ReLU 激活 → 最大池化。在每轮训练后,使用验证集计算分类准确率(Top-1 Accuracy),并记录训练损失和验证准确率的变化。- 训练完成后,使用测试集对模型进行评估,计算模型的准确率(Top-1 Accuracy)。- 绘制训练过程中的损失曲线和验证集准确率曲线,用于观察模型在训练过程中的表现。- 验证准确率在训练的初期阶段可能波动,但随着训练轮数的增加,准确率逐渐提高。原创 2025-07-31 10:43:37 · 906 阅读 · 0 评论 -
机器学习-深度学习的前向计算与反向传播算法
三、完整的Python代码及其相关注释说明。原创 2025-04-11 16:00:49 · 604 阅读 · 0 评论 -
机器学习--分类算法实验
而贝叶斯分类算法,特别是朴素贝叶斯分类器,其分类准确率高且计算效率显著,对缺失数据不敏感,这些特点使其在大规模数据集上表现出色。(3)降低独立性假设:为了降低朴素贝叶斯算法中属性独立性假设的影响,可以使用一些改进的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法等。在实际应用中,我们应结合问题的实际需求和数据特点,灵活选择并调优算法,以期达到最佳的分类效果。(2)忽略属性间的相关性:决策树假设属性之间相互独立,这在现实中往往不成立,可能影响模型的准确性。原创 2025-04-08 10:15:14 · 827 阅读 · 0 评论 -
机器学习--无监督学习实验
k-means聚类算法是一种基于划分的聚类算法,旨在将数据集划分为k个簇,使得每个簇内的数据点尽可能相似,而簇间的数据点尽可能不同。通过不断地迭代更新质心,k-means算法使得簇内的数据点之间的相似度最大化,簇与簇之间的相似度最小化,从而实现对数据集的聚类分析。(2)分配:计算每个数据点到所有质心的距离,并将每个数据点分配给距离其最近的质心所属的簇。(2)计算协方差矩阵:标准化后的数据集的协方差矩阵反映了各个特征之间的相关性。(3)更新:重新计算每个簇的质心,即计算簇内所有数据点的均值作为新的质心。原创 2025-04-08 10:20:32 · 739 阅读 · 0 评论 -
机器学习—集成学习算法实验
这些学习器可以是同质的,即所有基学习器都使用相同的算法,也可以是异质的,即基学习器使用不同的算法。参数调优:对 n_estimators 参数进行调整,尝试不同的值(如 20、50、100、200 等),观察模型在训练集和测试集上的准确率、损失值等指标的变化,以找到最优的参数设置。(提升法):通过迭代地训练基学习器,并逐步调整每个学习器的权重,使得后续学习器能够专注于前面学习器错误分类的样本,从而提高整体模型的预测性能。最后,通过投票或平均的方式将多个基学习器的预测结果结合起来,以降低方差。原创 2025-04-08 10:25:06 · 1056 阅读 · 0 评论 -
机器学习—BP神经网络
在正向传播过程中,数据从输入端输入后,沿着网络的指向,乘以对应的权重后再加和,再将结果作为输入在激活函数中计算,将计算的结果作为输入传递给下一个节点,依次计算,直到得到最终结果。反向传播则将输出的结果与期望的输出结果进行比较,将比较产生的误差利用网络进行反向传播,通过多次迭代,不断地对网络上的各个节点间的权重进行调整,直到得到满意的结果为止。在训练BP神经网络的过程中,我们记录了损失值,从损失曲线中可以看出,随着训练轮次的增加,损失值呈现逐渐下降的趋势。在本实验中,我们划分了20%的训练数据作为验证集。原创 2025-04-08 10:28:55 · 1057 阅读 · 0 评论 -
机器学习--集成学习算法实验
随机森林通过投票或平均等方式整合每棵决策树的预测结果,从而得到最终的预测结果。决策树的构建过程包括选择最优特征进行节点划分,直到满足停止条件(如节点中的样本数达到预设的阈值,或所有样本都属于同一类别等)。设置参数:例如,决策树的数量(nTrees)、每个节点分裂时考虑的特征数(trySubset)、最小叶节点大小(minLeafSize)等。对于分类问题,采用投票的方式确定最终的预测结果,即多数决策树预测的类别作为最终类别。对于回归问题,采用平均的方式得到最终的预测结果,即对所有决策树的预测结果取平均值。原创 2025-04-08 10:32:24 · 943 阅读 · 0 评论 -
机器学习-深度学习的库环境配置
Anaconda是一个轻量级的包管理器和环境管理工具,能够简化Python环境的管理,避免依赖冲突,且支持跨平台操作。实验目的:本次实验旨在完成深度学习的库环境配置,特别是建立Python开发环境,安装必要的工具和框架,确保开发过程中能顺利进行深度学习模型的开发、训练和测试。成功运行了Jupyter Notebook,并完成了PyTorch的基础示例代码,实现了对深度学习框架的基本操作和理解。通过本次实验,完成了深度学习开发环境的搭建,确保了基础工具和库的安装与使用,为后续的深度学习项目开发奠定了基础。原创 2025-04-11 15:07:10 · 1035 阅读 · 0 评论
分享