在机器学习中,生成训练集和测试集是一项重要的任务。通过将数据集分为训练集和测试集,我们可以用训练集来训练模型,并用测试集来评估模型的性能。在Python中,我们可以使用不同的方法来生成训练集和测试集。下面我将介绍几种常见的方法,并提供相应的源代码示例。
- 手动划分法:
手动划分法是最简单的生成训练集和测试集的方法之一。该方法通过手动指定数据集中的样本属于训练集还是测试集来进行划分。下面是一个使用手动划分法生成训练集和测试集的示例代码:
import numpy as np
# 生成样本数据
data = np.random.rand(100, 5) # 假设有100个样本,每个