18、机器学习分类器的构建与评估

机器学习分类器的构建与评估

在机器学习领域,分类任务是一项重要的工作。本文将详细介绍如何构建和评估分类器,以及如何处理过拟合和高偏差等问题。

决策树分类器的评估

我们可以通过计算混淆矩阵和卡帕统计量来评估决策树分类器的性能。以下是相关代码:

(defn ex-4-39 []
  (let [data (-> (load-data "titanic.tsv")
                 (i/transform-col :age age-categories)
                 (:rows))
        tree (decision-tree :survived [:pclass :sex :age] data)]
    (confusion-matrix (map :survived data)
                      (map (partial tree-classify tree) data))))

得到的混淆矩阵如下:
| | n | y |
|—|-----|-----|
| n | 763 | 46 |
| y | 219 | 281 |

从混淆矩阵中可以看出,分类器产生了大量的假阴性结果(219个)。接下来计算卡帕统计量:

(defn ex-4-40 []
  (let [data (-> (load-data "titanic.tsv")
          
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值