机器学习中的黑盒方法与市场篮分析
1. 提升字符识别模型性能
在字符识别领域,Frey和Slate在1991年发布的数据集上报告了约80%的识别准确率。借助多年来机器学习研究的积累,通过几行R代码,我们就能超越他们的结果。而我们还有进一步提升的空间。
之前的支持向量机(SVM)模型使用了简单的线性核函数。若采用更复杂的核函数,可将数据映射到更高维空间,从而可能获得更好的模型拟合效果。在众多不同的核函数中进行选择颇具挑战,常见做法是先尝试高斯径向基函数(RBF)核,它在许多类型的数据上表现出色。
以下是使用 ksvm() 函数训练基于RBF核的SVM的代码:
letter_classifier_rbf <- ksvm(letter ~ ., data = letters_train,
kernel = "rbfdot")
接着,像之前一样进行预测:
letter_predictions_rbf <- predict(letter_classifier_rbf,
letters_test)
最后,将其准确率与线性SVM进行比较:
agreement_rbf <- letter_predictions_rbf == lette
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



