机器学习实验与模型优化实践

最新推荐文章于 2025-12-04 16:26:39 发布

原创

最新推荐文章于 2025-12-04 16:26:39 发布 · 1.1k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 # 实验 # 模型优化

1、在 Google Colab 上创建一个账户，并查看示例笔记本以适应编码环境。

需在 Google Colab 创建账户，之后查看示例笔记本熟悉编码环境。

2、在微软Azure机器学习（AML）中创建一个账户，探索AML生态系统中的其他选项，熟悉可用的不同计算选项，并选择适合任务的计算资源以优化200美元的免费预算，具体该如何操作？

登录：点击Start并按标准登录流程操作。2022年时，AML免费访问仅限第一年，之后需付费订阅。登录后设置信用卡以启用服务，但首年免费。
进入服务：登录后进入中央Azure门户，点击“Products”，选择“Azure Machine Learning”。
升级账户：将账户升级为按使用量付费，有200美元信用额度启动。可选择“Basic”暂时不付款，点击“Upgrade”，还能为订阅命名。
开始使用：完成上述步骤后，可开始使用AML服务。不考虑已弃用的“Machine Learning Studio (Classic)”服务，选择“Machine Learning”并点击“create”。
计算资源选择：创建计算时可选择最便宜的仅CPU计算以优化成本，之后根据实验规模选择核心数量和内存大小。计算名称在整个AML生态系统中唯一，可使用用户名作为基础。
后续操作：创建计算后可开始第一个实验，在实验中创建新笔记本并迁移之前在Google Colab使用的第一个分类器程序。确保计算资源运行才能运行脚本。在AML中工作与在Google Colab基本相同，可安装缺失库，AML还支持创建管道和模型以及管理其生命周期。

3、创建一个Google Colab账户，并尝试执行示例代码。

在 Google Colab 按照常规注册流程创建账户，查看示例笔记本以熟悉编码设置，之后尝试执行示例代码。

4、使用scikit - learn包，导入KNN模块，并使用命令“from sklearn.neighbors import KNeighborsClassifier”将其应用于样本数据进行分类。

要完成此任务，可按以下步骤操作：

安装scikit-learn包（若未安装）；
准备样本数据；
编写Python代码，示例如下：

from sklearn.neighbors import KNeighborsClassifier
import numpy as np

# 示例样本数据
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])

# 创建KNN分类器对象
knn = KNeighborsClassifier()

# 训练模型
knn.fit(X, y)

# 进行预测
new_sample = np.array([[2.5, 3.5]])
prediction = knn.predict(new_sample)
print('预测结果:', prediction)

上述代码中，首先导入必要的模块，然后创建了示例样本数据，接着实例化KNeighborsClassifier对象，使用 fit 方法训练模型，最后对新样本进行预测。

5、重复之前进行过的实验来处理回归问题，使用 `from sklearn.neighbors import KNeighborsRegressor` 导入相应的回归器进行操作。

该要求是在使用 scikit-learn 包进行实验时，先按照之前用 KNN 模块进行分类的实验步骤，之后将其替换为使用 KNeighborsRegressor 进行回归问题的实验，具体做法是：

导入 KNeighborsRegressor ；
然后将其应用到所选的样本数据上开展回归分析。

6、使用sklearn.model_selection.train_test_split函数分离训练数据和测试数据。采用70%用于训练，30%用于测试，并重复多层感知器（MLP）训练，以比较测试准确率与之前使用相同数据进行MLP训练和测试的方法。

要完成此任务，可按以下步骤操作：

导入必要的库，包括 train_test_split 和 MLP 相关库；
准备好数据集；
使用 train_test_split 函数将数据集按 70% 训练、30% 测试的比例进行划分；
进行 MLP 训练，使用划分后的训练集训练模型；
使用测试集评估模型的准确率；
重复 MLP 训练过程，以多次试验的结果进行评估；
将此结果与之前使用相同数据进行训练和测试的 MLP 准确率进行对比。

以下是示例代码：

from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
import numpy as np

# 准备数据集
data = np.random.rand(100, 10)  # 示例数据，100个样本，每个样本10个特征
labels = np.random.ra