用sklearn进行手写数字的识别训练，获取学习率和惩罚系数，机器学习入门推荐案例（1）

最新推荐文章于 2024-05-10 03:45:00 发布

原创

最新推荐文章于 2024-05-10 03:45:00 发布 · 835 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了一种通过交叉验证方法寻找手写数字识别任务中逻辑回归模型的最佳学习率和惩罚系数的方法。通过枚举不同参数组合并评估其表现，最终确定最优参数配置。

理论总是让人感觉乏味和枯燥，对于学习率和惩罚系数是如何确定的呢？我们可以用列举法来评价每个参数的得分，进而获取最优的模型参数。

一、获取手写数据集合

from sklearn.datesets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
def load_data():
	data = load_digits()
	x, y = data.data, data.target
	#切割测试集和训练集
	train_x, test_x, train_y, test_y = train_test_split(test_size= 0.3, random_state=10)
	#标准化数据
	ss = StandardScaler()
	ss.fit(train_x)
	train_x = ss.transform(train_x)
	test_x = ss.transform(test_x)	
	return train_x, test_x, train_y, test_y;

处理完数据后，可以展示一下数据的样式，让我们看看图片张啥样

def show_img(X):
	images = X.reshape(-1, 8, 8 ) # 格式为（-1， 64,）图片格式为8 * 8
	# 构建绘图
	fig, axi = plt.subslots(3, 5)
	for i, ax in enumerate(axi.flat):
		img = images[i]
		ax.imshow(img, cmap='gray')
		ax.set(xticks=[], yticks=[])
	plt.tight_layout()
	plt.show