终极算法【1】——机器学习革命

当今,算法与我们息息相关,生活周围的手机、汽车、房子、家电和工厂等等,算法无时无刻不在发挥着作用。如果所有算法都突然停止运转,那么就是人类世界的末日。


算法就是一系列指令,告诉计算机该做什么。克劳德.香农以“信息论之父”为人们所知,他第一个意识到晶体管的活动就是运算。如果A晶体管只有在B和C晶体管都打开是才打开,那么这时它就是在做小型的逻辑运算;如果A晶体管在B和C晶体管其中一个打开时才打开,就是另外一种小型逻辑运算;如果A晶体管在B晶体管任何关闭的时候都打开,或者反过来,这又是第三种运算。所有算法,无论多复杂,都能分解为这三种逻辑运算:且、或、非。通过结合许多逻辑运算,我们可以进行极其复杂的逻辑推理。


每个算法都会有输入和输出:数据输入计算机,算法会利用数据完成接下来的事,然后结果就出来了。机器学习则颠倒了这个顺序:输入数据和想要的结果,输出的则是算法,即把数据转换成结果的算法。


计算机科学通常需要的是准确思维,但机器学习需要的是统计思维。在机器学习中,知识往往以统计模型的形式出现,因为多数知识是可以统计的。机器学习有许多不同的形式,也会涉及许多不同的名字:模式识别、统计建模、数据挖掘、知识发现、预测分析、数据科学、适应系统和自组织系统等。


机器学习有时会和人工智能混淆。严格讲,机器学习是人工智能的子域,但机器学习发展的如此之快,现已超越它的母领域。


在信息处理这个生态系统中,学习算法是*掠食者。数据库、网络爬虫、索引器等相当于食草动物,耐心地对无限领域中的数据进行蚕食。统计算法、线上分析处理等相当于食肉动物。食草动物有必要存在,没有它们,其他动物将无法存活,但*掠食者有更为刺激的生活。学习算法将所有这些信息吞下、消化,然后将其变为知识。


工业革命使手工业自动化,信息革命解放了脑力劳动,而机器学习则使自动化本身自动化。


机器学习无时无刻不在影响着我们:

  • 商业公司通过机器学习提高广告推送精度;
  • 机器学习给科学方法增压,科学家可能花毕生精力提出或验证几百个假设,而机器学习系统却能在几秒内做完这些事;
  • 学习算法关系国家安全,在网络空间之外,学习算法是保护国家的壁垒。


尽管机器学习发展很明显,但这也仅仅是未来的预告。虽然它有用,但实际上当今在工业上起作用的学习算法的生成还是受到了很大的限制。


怎样才能实现这个目标?学习算法如何运行?现在它们不能做什么?它们的下一代会是怎样的?机器学习革命将以什么方式呈现?你抓住哪些机遇,提防哪些危险?这些就是后续要分享的内容。

终极算法【1】——机器学习革命