【机器学习开放项目】教育数据挖掘

【机器学习开放项目】教育数据挖掘

开放的教育数据挖掘数据集合网站:

https://pslcdatashop.web.cmu.edu/

项目思路1:

对于每个数据集,您可以比较各种机器学习技术(至少5到7种不同的ML方法),以预测“正确的首次尝试值”。

For each dataset, you can compare various machine learning techniques (at least five to seven different ML methods) on predicting “Correct First Attempt values” (Generally listed in the column “Outcome”).

报告相应的均方根误差(RMSE)。

Please report the Root Mean Squared Error (RMSE).

项目思路2:

在数据集中,您可以比较多种机器学习技术(至少2到3种不同的ML方法),以预测“正确的首次尝试值”。

Across datasets, you can compare several machine learning techniques (at least two to three different ML methods) on predicting “Correct First Attempt values”(Generally listed in the column “Outcome”).

报告测试数据的均方根误差(RMSE)。

Please report the Root Mean Squared Error (RMSE) on the test data.

这里的假设前提是,可能没有绝对的赢家,不同的机器学习技术可能对不同的任务领域有效。

The hypothesis here is that there may not be an absolute winner, different machine learning techniques may be effective on different task domains.

例如,您可以将数据集分为科学(物理和数学)和第二语言学习(中文、法语)。

For example, you can split the datasets into science (physics & math) vs. second language learning (Chinese, French).

更多精彩文章请关注微信号:【机器学习开放项目】教育数据挖掘