机器学习中的预测模型与集成方法
1. 多分类问题:犯罪现场玻璃样本分类
1.1 多分类问题概述
在机器学习中,分类问题可分为二分类和多分类问题。二分类问题的标签和预测值只有两种可能,例如判断声纳反射是来自岩石还是地雷。而当标签和预测值有超过两种可能时,就属于多分类问题。这里我们使用惩罚线性回归来解决玻璃样本分类问题。
玻璃数据集包含 214 个样本,每个样本有 9 个物理化学测量值(如折射率和化学成分测量值),这些样本分为 6 种不同类型的玻璃。问题的目标是利用这些物理化学测量值来确定给定样本属于哪一种类型,该应用主要用于犯罪和事故现场的法医分析。
1.2 代码实现
以下是使用惩罚线性回归进行多分类的代码:
import urllib2
from math import sqrt, fabs, exp
import matplotlib.pyplot as plot
from sklearn.linear_model import enet_path
from sklearn.metrics import roc_auc_score, roc_curve
import numpy
target_url = ("https://archive.ics.uci.edu/ml/machine-learning-"
"databases/glass/glass.data")
data = urllib2.urlopen(target_url)
# arrange data into list for labels and lis
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



