机器学习在应用评价分析与生物医疗健康领域的应用探索
1. 苹果应用商店评价分析
1.1 混淆矩阵与性能指标
在二分类问题中,混淆矩阵是评估模型性能的重要工具。如下表所示:
| 数据类别 | 分类为正 | 分类为负 |
| — | — | — |
| 正 | 真阳性 (tp) | 假阴性 (fn) |
| 负 | 假阳性 (fp) | 真阴性 (tn) |
同时,还有一些性能指标,如精确率(Precision)、召回率(Recall)和 F 度量等,计算公式如下:
[F - Measure=\frac{2\times Precision\times Recall}{Precision + Recall}]
混淆矩阵可以用矩阵形式表示为:
[\begin{bmatrix}tp & fn\fp & tn\end{bmatrix}]
1.2 实验结果与分析
通过对特征和 n - 元语法进行组合实验,得到了以下主要结果:
1.2.1 最佳组合实验
最佳结果是在 TD - IDF 算法下,采用第三个组合(仅一元语法(unigram)和 500 个特征)与 SVM 模型,准确率达到 76.57%。以下是该组合下六种机器学习算法的准确率:
| 模型名称 | 准确率百分比 % |
| — | — |
| 朴素贝叶斯 | 72.84 |
| 随机森林 | 72.24 |
| 逻辑回归 | 76.42 |
| SVM | 76.57 |
| Ada
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



