什么是学习机器学习的好实施?

问题描述:

我发现学习新的主题最好有一个简单的实现代码来获得想法。这就是我学习遗传算法和遗传编程的方法。什么是一些很好的介绍性的程序来编写机器学习的开始?什么是学习机器学习的好实施?

最好,让任何引用的资源能够在线访问使社区能够受益

+0

什么是一般学习遗传算法的第一个简单实现? – zubinmehta 2011-06-06 08:11:23

+1

参加coursera.org的ML课程。 – ziggystar 2013-11-16 20:28:36

我想你可以写垃圾邮件过滤一个“朴素贝叶斯”分类。 您可以从本书中获得大量信息。

http://nlp.stanford.edu/IR-book/information-retrieval-book.html

+1

这是另一本很棒的免费书籍 - 统计学习元素 - www-stat.stanford.edu/~hastie/Papers/ESLII.pdf – tathagata 2010-07-05 05:01:53

+0

在我看来,EoSL有些困难。它不适合作为初次阅读,它的水平是研究生。 – lmsasu 2010-08-09 07:09:31

+0

是的,我也同意Imsasu。但“信息检索概论”一书并不难读懂。 – 2010-08-09 07:41:53

决策树。它经常用于分类任务,并且有很多变体。汤姆米切尔的书是一个很好的参考来实现它。

有一种叫做书的东西;你熟悉那些吗?当我二十年前探索AI时,有很多书。我想现在互联网是存在的,书籍是古老的,但你可以在古老的图书馆找到一些。

+0

对不起,人们认为书不好,但书中有丰富的资源。书籍比这里的其他答案更有帮助。 – 2010-07-07 16:36:51

+2

我想你不能读其他答案,引用好书... – Malcolm 2012-07-25 15:13:38

你会开发什么语言?如果你是灵活的,我建议Matlab,Python和R作为优秀的候选人。这些是用于开发和评估算法的一些更常用的语言。它们促进快速算法开发和评估,数据处理和可视化。大多数流行的ML算法也可以作为库(有源代码)。

我首先关注R2中的基本分类和/或聚类练习。它更容易可视化,而且它通常足以探索ML中的问题,如风险,班级失衡,嘈杂的标签,在线与离线培训等。从日常生活或您感兴趣的问题创建数据集,或者使用一个经典的,如虹膜数据集,所以你可以比较你的进展和发表的文献。你可以找到在虹膜数据集:

它的一个不错的功能是,它有一个类,“setosa”,这是很容易地从线性可分其他。

一旦你选择了一些有趣的数据集,首先实现一些标准分类器并检查它们的性能。这是分类的一个很好的短名单学习:

  • k-最近邻
  • 线性判别分析
  • 决策树(例如C4.5)
  • 支持向量机(例如,通过LIBSVM )
  • 提升(与树桩)
  • 朴素贝叶斯分类器

无线虹膜数据集和我提到的其中一种语言,您可以使用任何分类器轻松地进行小型研究(几分钟到几小时,取决于您的速度)。

编辑:你可以谷歌“虹膜数据分类”找到很多的例子。下面是使用Mathworks公司虹膜数据集的分类演示文档:

http://www.mathworks.com/products/statistics/demos.html?file=/products/demos/shipping/stats/classdemo.html

神经网络可能是第一个最容易实现的事情,而且他们相当彻底整个文学覆盖。

+0

这将是一个很好的资源:http://neuralnetworksanddeeplearning.com/ – marbel 2015-02-19 01:24:42