1、在 Google Colab 上创建一个账户,并查看示例笔记本以适应编码环境。
需在 Google Colab 创建账户,之后查看示例笔记本熟悉编码环境。
2、在微软Azure机器学习(AML)中创建一个账户,探索AML生态系统中的其他选项,熟悉可用的不同计算选项,并选择适合任务的计算资源以优化200美元的免费预算,具体该如何操作?
-
登录:点击Start并按标准登录流程操作。2022年时,AML免费访问仅限第一年,之后需付费订阅。登录后设置信用卡以启用服务,但首年免费。
-
进入服务:登录后进入中央Azure门户,点击“Products”,选择“Azure Machine Learning”。
-
升级账户:将账户升级为按使用量付费,有200美元信用额度启动。可选择“Basic”暂时不付款,点击“Upgrade”,还能为订阅命名。
-
开始使用:完成上述步骤后,可开始使用AML服务。不考虑已弃用的“Machine Learning Studio (Classic)”服务,选择“Machine Learning”并点击“create”。
-
计算资源选择:创建计算时可选择最便宜的仅CPU计算以优化成本,之后根据实验规模选择核心数量和内存大小。计算名称在整个AML生态系统中唯一,可使用用户名作为基础。
-
后续操作:创建计算后可开始第一个实验,在实验中创建新笔记本并迁移之前在Google Colab使用的第一个分类器程序。确保计算资源运行才能运行脚本。在AML中工作与在Google Colab基本相同,可安装缺失库,AML还支持创建管道和模型以及管理其生命周期。
3、创建一个Google Colab账户,并尝试执行示例代码。
在 Google Colab 按照常规注册流程创建账户,查看示例笔记本以熟悉编码设置,之后尝试执行示例代码。
4、使用scikit - learn包,导入KNN模块,并使用命令“from sklearn.neighbors import KNeighborsClassifier”将其应用于样本数据进行分类。
要完成此任务,可按以下步骤操作:
- 安装scikit-learn包(若未安装);
- 准备样本数据;
- 编写Python代码,示例如下:
from sklearn.neighbors import KNeighborsClassifier
import numpy as np
# 示例样本数据
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
# 创建KNN分类器对象
knn = KNeighborsClassifier()
# 训练模型
knn.fit(X, y)
# 进行预测
new_sample = np.array([[2.5, 3.5]])
prediction = knn.predict(new_sample)
print('预测结果:', prediction)
上述代码中,首先导入必要的模块,然后创建了示例样本数据,接着实例化KNeighborsClassifier对象,使用 fit 方法训练模型,最后对新样本进行预测。
5、重复之前进行过的实验来处理回归问题,使用 from sklearn.neighbors import KNeighborsRegressor 导入相应的回归器进行操作。
该要求是在使用 scikit-learn 包进行实验时,先按照之前用 KNN 模块进行分类的实验步骤,之后将其替换为使用 KNeighborsRegressor 进行回归问题的实验,具体做法是:
- 导入
KNeighborsRegressor; - 然后将其应用到所选的样本数据上开展回归分析。
6、使用sklearn.model_selection.train_test_split函数分离训练数据和测试数据。采用70%用于训练,30%用于测试,并重复多层感知器(MLP)训练,以比较测试准确率与之前使用相同数据进行MLP训练和测试的方法。
要完成此任务,可按以下步骤操作:
- 导入必要的库,包括
train_test_split和 MLP 相关库; - 准备好数据集;
- 使用
train_test_split函数将数据集按 70% 训练、30% 测试的比例进行划分; - 进行 MLP 训练,使用划分后的训练集训练模型;
- 使用测试集评估模型的准确率;
- 重复 MLP 训练过程,以多次试验的结果进行评估;
- 将此结果与之前使用相同数据进行训练和测试的 MLP 准确率进行对比。
以下是示例代码:
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
import numpy as np
# 准备数据集
data = np.random.rand(100, 10) # 示例数据,100个样本,每个样本10个特征
labels = np.random.ra

最低0.47元/天 解锁文章
1512

被折叠的 条评论
为什么被折叠?



