理论总是让人感觉乏味和枯燥,对于学习率和惩罚系数是如何确定的呢?我们可以用列举法来评价每个参数的得分,进而获取最优的模型参数。
一、 获取手写数据集合
from sklearn.datesets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
def load_data():
data = load_digits()
x, y = data.data, data.target
#切割测试集和训练集
train_x, test_x, train_y, test_y = train_test_split(test_size= 0.3, random_state=10)
#标准化数据
ss = StandardScaler()
ss.fit(train_x)
train_x = ss.transform(train_x)
test_x = ss.transform(test_x)
return train_x, test_x, train_y, test_y;
处理完数据后,可以展示一下数据的样式,让我们看看图片张啥样
def show_img(X):
images = X.reshape(-1, 8, 8 ) # 格式为(-1, 64,)图片格式为8 * 8
# 构建绘图
fig, axi = plt.subslots(3, 5)
for i, ax in enumerate(axi.flat):
img = images[i]
ax.imshow(img, cmap='gray')
ax.set(xticks=[], yticks=[])
plt.tight_layout()
plt.show

本文介绍了一种通过交叉验证方法寻找手写数字识别任务中逻辑回归模型的最佳学习率和惩罚系数的方法。通过枚举不同参数组合并评估其表现,最终确定最优参数配置。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



