X和Y不相关,但Y是Xin随机森林分类器的预测。如何使用统计和机器学习来表示这一点?

X和Y不相关,但Y是Xin随机森林分类器的预测。如何使用统计和机器学习来表示这一点?

问题描述:

X和Y是不相关的(0.3);然而,当我把X在随机森林分类预测Y,旁边两(A,B)其他(相关)变量,X和两个其他变量(A,B)为Y.注意的显著预测的是,其他两个(A, B)变量也无法与Y. 相关怎样才能根据统计和机器学习的想法解释这一点。X和Y不相关,但Y是Xin随机森林分类器的预测。如何使用统计和机器学习来表示这一点?

代表一个或多个可变(A或B或Y)相对于另一变量(X),其中变量不具有很强的相关性。

+0

发现这可能是https://stats.stackexchange.com/一个更好的问题 – Pace

相关性是线性的。如果存在非线性关系,则可能看不到相关性。

随机森林(决策树是非线性的),所以你能预测发现一个随机森林,即使相关性为零。

A quadratic function could have zero correlation between X and Y

对相关

该图像,更可以在 https://www.statisticalengineering.com/correlation.htm