在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分训练集(train set),校验集(validation set ) 和测试集(test set)。校验集是用来做模型选择(model selection),即做模型的最终优化及确定的数据集。在实际应用中,校验集是可选的,因为校验集主要作用是辅助模型构建。