什么是学习机器学习的好实施?
我发现学习新的主题最好有一个简单的实现代码来获得想法。这就是我学习遗传算法和遗传编程的方法。什么是一些很好的介绍性的程序来编写机器学习的开始?什么是学习机器学习的好实施?
最好,让任何引用的资源能够在线访问使社区能够受益
我想你可以写垃圾邮件过滤一个“朴素贝叶斯”分类。 您可以从本书中获得大量信息。
http://nlp.stanford.edu/IR-book/information-retrieval-book.html
决策树。它经常用于分类任务,并且有很多变体。汤姆米切尔的书是一个很好的参考来实现它。
有一种叫做书的东西;你熟悉那些吗?当我二十年前探索AI时,有很多书。我想现在互联网是存在的,书籍是古老的,但你可以在古老的图书馆找到一些。
对不起,人们认为书不好,但书中有丰富的资源。书籍比这里的其他答案更有帮助。 – 2010-07-07 16:36:51
我想你不能读其他答案,引用好书... – Malcolm 2012-07-25 15:13:38
你会开发什么语言?如果你是灵活的,我建议Matlab,Python和R作为优秀的候选人。这些是用于开发和评估算法的一些更常用的语言。它们促进快速算法开发和评估,数据处理和可视化。大多数流行的ML算法也可以作为库(有源代码)。
我首先关注R2中的基本分类和/或聚类练习。它更容易可视化,而且它通常足以探索ML中的问题,如风险,班级失衡,嘈杂的标签,在线与离线培训等。从日常生活或您感兴趣的问题创建数据集,或者使用一个经典的,如虹膜数据集,所以你可以比较你的进展和发表的文献。你可以找到在虹膜数据集:
它的一个不错的功能是,它有一个类,“setosa”,这是很容易地从线性可分其他。
一旦你选择了一些有趣的数据集,首先实现一些标准分类器并检查它们的性能。这是分类的一个很好的短名单学习:
- k-最近邻
- 线性判别分析
- 决策树(例如C4.5)
- 支持向量机(例如,通过LIBSVM )
- 提升(与树桩)
- 朴素贝叶斯分类器
无线虹膜数据集和我提到的其中一种语言,您可以使用任何分类器轻松地进行小型研究(几分钟到几小时,取决于您的速度)。
编辑:你可以谷歌“虹膜数据分类”找到很多的例子。下面是使用Mathworks公司虹膜数据集的分类演示文档:
神经网络可能是第一个最容易实现的事情,而且他们相当彻底整个文学覆盖。
这将是一个很好的资源:http://neuralnetworksanddeeplearning.com/ – marbel 2015-02-19 01:24:42
什么是一般学习遗传算法的第一个简单实现? – zubinmehta 2011-06-06 08:11:23
参加coursera.org的ML课程。 – ziggystar 2013-11-16 20:28:36