机器学习概述

万物皆可AI

人工智能(Artificial Intelligence) 1956年，几个计算机科学家相聚在达特茅斯会议，提出了“人工智能”的概念，梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。
我的理解，人工智能概念是指对机器模拟人类智慧来进行一系列智能活动的统称。人工智能的研究领域也在不断扩大，下图展示了人工智能研究的各个分支，包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。

机器学习（一）之概述

机器学习

Mechine Learing(机器学习)是研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

机器学习，重点在于“学习”

机器学习是一种实现人工智能的方法。机器学习最基本的做法，是使用算法来解析数据、从中学习，然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同，机器学习是用大量的数据来“训练”，通过各种算法从数据中学习如何完成任务。

机器学习，不同于我们人类的学习。人类的学习是一个笼统的概念，大脑可以通过一切方式学习一切事物，包括记忆、理解、推演、重复、归纳、感悟等等。而目前的机器学习，似乎总是要能将一个问题抽象出来，成为可以书写的数学表达式，机器方能循律学习。

机器学习应用场景

对非研究人员，ML是一个科技黑箱，一个潘多拉的魔盒，你无法想象计算机如何拥有这些神奇的魔法：人脸识别、自动驾驶、自主泊车、语音识别、智能推荐、数据挖掘、筛选垃圾邮件、预估房价、人机对战…
一部分能通过人脑完成的事情，机器也能学习出来，利用严谨的数学公式，她可以做到谨小慎微、一丝不苟，几近完美地无可挑剔。

机器学习算法分类

目前存在几种不同类型的学习算法，为监督学习(Supervised Learning),无监督学习(Unsupervised Learning)、半监督学习(Semi-Supervised Learning)和强化学习(Reinforcement Learning)。
其中最常用的两种类型我们称为监督学习和非监督学习。

监督学习(Supervised Learing)
简单来讲，监督学习是我们教计算机如何去完成任务。具体地，我们会对训练样本进行标记，例如，我们可以人为标记垃圾邮件，以帮助机器根据训练样本的特征及标签，学习如何进行邮件分类。
监督学习主要可以分为两大类：分类问题(Classfication)和回归问题(Regression)。
分类问题：即是定性输出。典型的算法有逻辑回归(Logistic Regression)和神经网络(Neural Network)。
可以这么理解，逻辑回归是只含有一层神经元的单层神经网络，用于简单二分类问题，而神经网络是复杂的多层神经元的多层神经网络，用于复杂的多分类问题。
回归问题：即是定量输出。典型的算法有线性回归(Linear Regression)。
这个问题相当于简单的数值分析，最小化目标函数的问题。典型求解方法是梯度下降法(Gradent descent)。

非监督学习(Unsupervised Learing)
简单来讲，非监督学习是我们让计算机自己进行学习。我们的训练样本是不给定标签的，由机器自主学习特征。典型应用场景是网页的新闻资讯聚类。
听起来有点神奇，但结合其应用场景，就很容易想明白。根据训练集具有的相似特征，将其划分为不同的聚类集。但由于没有标定标签特征，学习的结果不一定完美。
典型算法有K均值（K-Means）算法及主成分分析（Principal Component Analysis）算法。

小结

机器学习初学者，一周时间学完Andrew Ng2014机器学习课程，在此总结学习内容，以供交流、查阅。
参考斯坦福大学吴恩达2014机器学习课程.
参考博文.