您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

scikit Learn中的样本权重和班级权重选项有什么区别?

scikit Learn中的样本权重和班级权重选项有什么区别?

这是类似的概念,但是使用sample_weights可以强制估计器对某些样本给予更多的关注,而使用class_weights可以强制估计器对某些特定类的学习。sample_weight = 0或class_weight = 0基本上意味着估计器在学习过程中根本不需要考虑此类样本/类。因此,例如,如果此类的class_weight = 0,则分类器将永远不会预测某个类别。如果某些sample_weight / class_weight大于其他样本/类的sample_weight / class_weight-估计器将首先尝试最小化该样本/类的错误。您可以同时使用用户定义的sample_weights和class_weights。

如果您想通过简单的克隆/删除来对训练集进行欠采样/过采样-这等于增加/减少相应的sample_weights / class_weights。

在更复杂的情况下,您还可以尝试使用SMOTE之类的技术人工生成样本。

其他 2022/1/1 18:36:16 有387人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶