这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
本文是根据Stefan Kojouharov发表在Medium上的文章整理而成的一份人工智能、神经网络、机器学习、深度学习和大数据方面的速查表。为了便于查找与使用,本文对每个主题进行了分类,希望可以对各位的工作有所帮助。
注意!这可能是相关领域最全的的一份速查表,文末还列出了各种算法的复杂度统计。
神经网络
神经网络图
机器学习概览
机器学习:Scikit-learn 算法
如果在你的项目中出现了一些未知问题,那么这份机器学习速查表可以帮助你快速地找到出问题的那部分。下面这个流程图可以帮助你快速的浏览文档并快速导航,这可以帮助你更深入的理解问题的原因,同时为你提供对应的解决方案。
Scikit-Learn
Scikit-learn(原scikits.learn) 是基于Python的一款免费机器学习库。它涵盖了很多分类、回归以及聚类算法,包括支持向量机、随机森林、梯度加速、k-means聚类以及DBSGAN聚类算法。该库可以与Python的科学计算库Numpy以及SciPy互操作。
机器学习:算法速查表
这份来自微软Azure的机器学习速查表可以帮助你在解决方案的预分析过程中快速选择合适的机器学习算法。使用这份速查表时,你可以根据自己的目的和数据特征快速地选择对应的算法。
Python的数据科学相关功能
TensorFlow
2017年5月,Google发布了第二代TPU(张量计算单元),同时在谷歌计算引擎上提供了TPU集群。第二代TPU提供了高达每秒180万亿次的浮点数运算能力,由64个TPU组成的集群可以提供每秒1.15亿亿次的浮点数运算能力。
Keras
2017年,Google的TensorFlow团队决定在TensorFlow的核心库中添加Keras支持。Ghollet解释说,Keras是按接口来设计的,而不是一个端到端的机器学习框架。它代表着更高级、更直观的使用方式,这使得配置神经网络变得更为简单,用户不需要再去了解复杂的后端科学计算库。
Numpy
Numpy 旨在作为Python的CPython参考实现,它是一个非优化的字节码解释器。针对这个Python版本编写的一些数学算法通常比相同代码的编译版本慢一些。Numpy通过提供多维数组和函数,以及在数组上的高效运算符来解决运算缓慢的问题,这需要需要重写一些代码,主要是使用NumPy的一些内循环。
Pandas
“Pandas” 这个名称来源于术语 “面板数据”, 这是多维结构化数据集的一个计量经济学术语。
数据清洗
“数据清洗”正逐渐渗入流行文化。在2017年的电影《金刚:骷髅岛》中,由Marc Evan Jackson扮演的角色Steve Woodward就是一位数据清洗师。
使用dplyr和tidyr进行数据清洗
Scipy
Scipy是基于Numpy数组对象的一个科学计算库,它是NumPy全家桶(包括Matplotlib、Pandas、SymPy等工具包)的一部分,也是科学计算库的一个扩展集。这个Numpy全家桶与其他应用程序(如MATLAB、GNU Octave和Scilab)有很多共同的用户。NumPy全家桶有时也被称为SciPy全家桶。
Matplotlib
Matplotlib是一个面向Python编程语言及其数学计算库NumPy的绘图工具库。Matplotlib提供了面向对象的API,它使用通用的GUI工具包(例如Tkinter、wxPython、Qt或者GTK+)。虽然也有基于状态机的程序接口“pylab“(像OpenGL),其设计与MATLAB非常相似,但是大家却不提倡使用它。SciPy使用了matplotlib。
pyplot是matplotlib中的一个模块,提供类似MATLAB的接口。按照设计,Matplotlib可以跟MATLAB一样使用,你可以在Python中使用它,并且是免费的。
数据可视化
PySpark
Big-O(时间复杂度)
关于作者
Stefan是Chatbot’s Life的创始人,这是一家聊天机器人媒体和咨询公司。到目前为止,Chatbot’s Life每月的浏览量超过了150k,成了在线学习Bots\u0026amp;AI的优质资源。同时,Chatbot’s Life还为多家顶级机器人企业提供咨询工作,例如Swelly、Instavest、OutBrain和NearGrop。
查看英文原文:Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning \u0026amp; Big Data