开发机器学习应用程序的步骤

通常从数据的提炼,到最后算法的应用,遵循如下几个步骤:

开发机器学习应用程序的步骤

1、收集数据

收集我们关心的数据,方法如:网络爬虫,一些设备发送过来的数据,如从物联网设备获取来的数据。


2、准备输入数据

得到数据之后,我们要确保得到的数据格式符合要求。如某些算法要求特征值需要使用特定的格式。


3、分析输入的数据。查看是否有明显的异常值,如某些数据点和数据集中的其他值存在明显的差异。通过一维,二维或者三维图形化展示数据是个不错的方法,但是我们得到的数据的特征值都不会低于三个,无法一次图形化展示所有特征。我们可以通过数据的提炼,压缩多维特征到二维或者一维。


4、训练算法

机器学习算法从这一步,才真正的开始。考虑算法是属于监督学习算法还是无监督学习算法。

如果使用无监督学习算法,由于不存在目标变量值,故而也不需要训练算法,所有与算法相关的内容都在第5步。


5、测试算法

这一步将实际使用第4步机器学习得到的知识信息。为了评估算法,必须测试算法工作的效果。对于监督学习,必须已知用于评估算法的目标变量值;对于无监督学习,也必须通过其他的评测手段来检测算法的成功率。如果不满意预测结果,返回第四步。


6、使用算法

这一步是将机器学习算法转化为应用程序,执行实际任务。