
合理增加学习数据
当机器学习训练数据量不足时,如何尽可能合理地增加数据是一个常见的难题。
一种方法是重采样,即直接复制现有数据。此外,过采样可以创建新数据,如 SMOTE 算法和数据增强技术。
然而,需要注意的是,并不是所有数据删除操作都是有益的。例如,将 NUM1 中的一个 A 删除可能不会显着改善数据集,因为重采样也会生成相同的数据。
一个更有效的方法是创建真正的新数据,但要注意以下几点:
不要对测试数据造数据。 测试集应使用真实数据。 确保造出的数据符合原始数据集的分布。
欲了解更多信息,请参阅有关处理不平衡数据集的博客:https://www.cnblogs.com/wuliytTaotao/p/9308944.html。
以上就是机器学习训练数据不足怎么办?如何有效增加数据?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1351246.html
微信扫一扫
支付宝扫一扫