深度学习技巧之Early Stopping(早停法)
一、早停法简介(Early Stopping)
当我们训神经网络的时候通常希望能获得最好的泛化性能(,即可以很好地拟合数据)。但是所有的标准深度学习神经网络结构如全连接多层感知机都很容易:当网络在训练集上表现越来越好,错误率越来越低的时候,实际上在某一刻,它在测试集的表现已经开始变差。
模型的泛化能力通常使用模型在验证数据集(**validation set**)上的表现来评估。随着网络的优化,我们期望的理想中的泛化错误如图1所示。即当模型在训练集上的误差降低的时候,其在验证集上的误差表现不会变差。反之,当模型在训练集上表现很好,在验证集上表现很差的时候,我们认为模型出现了**过拟合**(overfitting)的情况。
