众所周知,在机器学习深度学习领域,合理划分训练集验证集和测试集是很重要的,本文主要介绍如何划分。

过去,人们运用机器学习传统方法的时候,一般将训练集和测试集划为7:3.

若有验证集,则划为6:2:2. 这样划分确实很科学,当数据量不大的时候(万级别及以下)。


但到了大数据时代,数据量陡增为百万级别,此时我们不需要那么多的验证集和训练集。

假设有100W条数据,只需要拿出1W条来当验证集,1W条来当测试集,就能很好地work了。

因此,在深度学习中若是数据很大,我们可以将训练集、验证集、测试集比例调整为98:1:1



Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐