训练集、验证集、测试集比较

训练集验证集测试集
功能用来训练机器学习模型的数据集用来调整机器学习模型的超参数(如学习率、正则化参数等)的数据集在训练和验证后用于评估模型性能的数据集
规模通常是数据集的大部分,可以包含成千上万的样本验证集通常是从训练集中划分出来的,通常包含数百到数千个样本测试集通常是从数据集中划分出来的,通常包含数百到数千个样本
来源划分通过留出法、交叉验证法、自助法等方法来将数据集划分为训练集和验证集可以是原始数据集中划分出来的;可以是外部真实数据集