基于H2O的随机森林模型在转换为POJO时预测始终为1

问题描述:

我是机器学习的新手,在使用随机森林算法的不平衡数据集上进行预测。我在R中构建模型,响应变量是二元类别(0,1)。 R中建立的随机森林模型产生了适当的分类,但是当这个模型被转换为构建应用程序的时候,模型只返回“1”作为响应。基于H2O的随机森林模型在转换为POJO时预测始终为1

[更新:答案写OP编辑为澄清该问题出现只转换为POJO前 - 看评论]

我敢打赌,你的数据集是高度不平衡,即您你的训练集中有更多的1比0更多。

即使您在模型拟合过程中获得了很好的准确性,在这种情况下,作为度量标准的准确度毫无意义,您应该使用精度,召回率和混淆矩阵来代替 - 谷歌“类不平衡”。举例来说,如果85%的培训标签是1,那么通过将所有样本归类为1(可以说不是什么确切数据),您可以简单地(并且天真地)将85%的准确性“分类器”你正在寻找)。

+0

我在Rstudio中运行模型时得到了适当的预测,但是当我在构建h2o POJO并在gradle构建器上运行后运行同一模型时,我得到的错误是我的所有测试数据具有相同的类输出为1 –

+1

@ VenkataKrishnan,为什么你没有在你的文章中包含这些信息? – desertnaut