学习数据科学:我们最喜欢的Python资源

学习数据科学:我们最喜欢的Python资源

Python是数据工程师和数据科学家都使用的通用语言。 这是因为它可以使数据工程师需要执行的操作工作自动化,并且拥有数据科学家所需的算法,分析和数据可视化库。

在这两个版本中,仅需几行代码即可简化管理,自动化和分析数据的需求。 如此之多,以至于我们在许多以数据为中心的从业者图书馆中都读到过其中的一本书,这本书是《用Python自动化无聊的东西》

本书涵盖了python基础知识和一些简单的自动化技巧。 对于在Excel中大量工作的业务分析人员来说,这尤其有用。

也有O'Reilly撰写的书籍,对基础知识也有很好的概述。

学习数据科学:我们最喜欢的Python资源

您可以使用Python Cookbook开始书籍清单。 本书涵盖了非常重要的主题,例如文件/ IO,数据结构,网络,算法等。所有这些主题都是任何技术驱动型职业的良好基础。 它内容广泛,将使您对python可以做的事情有一个很好的了解,同时也向您介绍一些常见的编程原理,例如对象,类,数据结构和算法。 如果您更喜欢这本书,则无需购买自动化书。 这将涵盖除excel之外的大多数主题。 如果您真的想了解有关python和excel的更多信息,可以随时阅读openpyxl 老实说,如果您是一个喜欢阅读技术文档而不是阅读书籍的人,那可能就是您要走的路(我们通常是读书人)。

免费的Python视频

如果您不喜欢读书,喜欢免费的YouTube教程,那么这里是我们的最爱之一。

创作者Corey Schafer(YouTuber)。 有大量关于Python,Django,GitHub,Linux等的完整教程。 对于有兴趣进入技术领域的人来说,所有这些都是非常实用的技能。 此外,他的视频非常易于跟随。 下面的视频是关于对象和类的,它们可能会更高级。 如果您只是开始观看视频

现在,一些python教程很有趣。 好的,实际上下一个是由TechLead创建的。 对于那些不认识TechLead而不是程序员的人,很难说,但他很搞笑。 他的大多数视频都有些开玩笑,有些严肃。 能够说出细微差别……需要在技术行业工作。 例如,在此视频中,他实际上是在模拟python教程。 进入科技行业的一部分是学习幽默的另一面。 它往往是非常利基和模因。

熊猫资源

一旦您对python普遍感到满意,那么学习越来越多的库就变得容易得多。

Pandas是一个数据处理库,可让您对数据集运行转换和基本分析。 我们的建议之一是,作为用户,您需要考虑Pandas在何处提供价值与SQL。 通过SQL使用Pandas并非总是有益的。 这可能有很多原因。 如果您在计算机上运行的Jupyter笔记本中运行Pandas,则您正在执行的任何数据处理都将在计算机的有限内存中进行。

大多数大型公司或至少是科技公司都将使用某种形式的云计算来运行Jupyter Notebook。 尽管如此,python并不总是最适合快速数据转换的工具。 我们已经看到有人在python中开发了date_diff函数,该函数花了5分钟才能运行一百万行,而如果他们在SQL中运行它,则可能要花1秒。 这是一个重要说明,因为可以想象如果不是100万行,而是10亿行。 那就是运行时间增加了1000倍(好吧,计算并不是那么简单,但要点……要长得多)。

熊猫仍然占有一席之地,对于准备和分析数据非常有用。 以下是熊猫的一些实用资源:

使用Python和Pandas进行数据分析

Sentdex是一个很棒的youtube,他确实使python变得简单。 除了熊猫,他还为多个主题创建了python教程。 但是我们非常感谢他脚踏实地的风格。 他假设您从零地面开始,然后从零开始建造。

这就是我们认为他的视频可能是Youtube上一些最有效的****的原因。 另外,他的风格很容易效仿。

用熊猫在10分钟内进行Python数据分析| Udemy讲师,弗兰克

我们想分享由弗兰克·凯恩(Frank Kane)创建的免费Udemy视频。 您将看到我们再几次引用该教师。 他是最专业的课程创建者之一。 现在,该视频是免费的。 但是,弗兰克·凯恩(Frank Kane)确实制作了许多我们付费并喜欢的高质量课程。 他开设了从初学者到免费提供python和许多其他现代技术概念的课程。 他还为Python和机器学习编写了一本书

最后,我们没有很多长视频。 通常,一次观看一个小时通常很困难。 我们喜欢并想分享一个。 如果您只是入门,并且想在Pandas上学习速成课程,请查看下面的视频。 我们对以下视频的一句话是,请确保您更改视频质量。 对于我们来说,它开始可怕,直到您将其转换为720p。

熊猫Python书

我们没有很多免费的在线图书可供Pandas使用。 因此,在这种情况下,我们将推荐一些可以在亚马逊或O'Reilly进行10天免费试用的书籍 实际上,这至少是找到您可能喜欢购买的书的好方法!

在这里,经典Python For Data Analysis不会出错。

学习数据科学:我们最喜欢的Python资源
来自亚马逊的图片

本书将涵盖所有基础知识,例如数据聚合和时间序列,同时通过基本的python练习来帮助您学习如何将Pandas应用于实际问题。 这是我们在书本或课程中寻找的特征之一。 我们倾向于需要可以应用我们的技能的实际问题。 它使框架和解决问题变得更加容易。
正如它指出的那样,这本书确实将带您了解“在Python中操作,处理,清理和处理数据的要点”。 这些技能对于数据科学家至关重要,因为您的大部分时间都将集中在清理和处理数据上。

这可能是我们推荐的少数几本熊猫书之一。 我们还将很快将许多其他数据科学和机器学习书籍添加到此列表中。 但是,我们所推荐的书中并没有太多关于熊猫的书。

到目前为止,Python还有其他几个库。 如果您希望参与机器学习和深度学习,它们是使简化复杂模型,算法和神经网络编程的核心库。

机器学习和深度学习Python

学习数据科学:我们最喜欢的Python资源

熊猫具有许多基本的分析功能。 它汇总并运行基本的描述性统计过程。 为了做到轻松应用更多高级模型。 您将需要学习Scikit学习。 现在,我们……这么说。 仅仅学习库的工作原理并不能使您成为一名机器学习工程师。 它是要了解的重要库之一,因为它包含了科学家将在python中使用的大多数模型数据。

同样,Sentdex拥有大量实用的教程。

Scikit学习机器学习SVM教程

Sentdex已经存在了一段时间,所以对于较新的内容,您可以查看Simplilearn。 它有一些较新的视频,他们在深入研究方面做得很好。 我们确实希望他们能获得更好的音频质量,但除此之外,它还是一整套用于学习Scikit学习的视频。

Scikit学习教程

Tensorflow和深度学习

Python拥有的另一个库是Tensorflow。 该库使您可以轻松地建立神经网络。 如果您是从头开始开发的,则无需创建感知器类或任何其他形式的对象/类

实际上,十个跟随是用这种方法编写的,它在编译时的行为更像一个图形,然后将其转换为c代码。

_Hvass Laboratories创建了一个很棒的,稍微隐藏的视频系列。 这个系列的优点是它不仅会引导您使用Tensorflow。 它还引用了一个GitHub,您可以使用它轻松地进行后续操作。 他的所有代码都已经写完了。 这使您可以轻松进行后续操作。

再次,我们必须再次向Sentdex大喊大叫,因为它最容易遵循Tensorflow的介绍。

Python机器学习书籍建议
对于书籍,我们建议使用Python Cookbook进行机器学习:从预处理到深度学习的实用解决方案。

学习数据科学:我们最喜欢的Python资源
来自亚马逊的图片

本书将从线性回归和KNN等主题入手,然后深入探讨诸如神经网络之类的深度学习概念。 同样,与其他许多O'Reilly书籍一样,它有很多很好的实际例子,都得到了很好的解释。

张量流

使用Scikit-Learn和TensorFlow进行动手机器学习:构建智能系统的概念,工具和技术

如果您想了解Tensorflow,请跳过上面的书,而仅使用此书。 它对机器学习的影响要轻一些(但仍然非常全面),但是下半部分100%专用于神经网络。 它涵盖了卷积神经网络,自动编码器,辍学等主题,以及其他非常重要的主题,这些主题对于使用Tensorflow进行深度学习都非常重要。

Python机器学习课程

我们也有一些课程,我们也想推荐这个话题。

我们已经提到了弗兰克,但我们也认为基里尔·埃雷缅科是另一位出色的讲师。 他们不仅是出色的老师,而且在涉及这些主题时,他们显然拥有深刻的理解。

弗兰克·凯恩(Frank Kane)在机器学习方面有一门很棒的课程 ,他将带您从线性回归转向支持向量机。 他还将讨论合奏学习和偏向权衡等等。 另外,如果您是视觉学习者,这可能会使您受益更多。 还有一整节关于Apache Spark的机器学习的知识,它使您可以将这些技术扩展到在计算集群上分析的“大数据”。

弗兰克·凯恩(Frank Kane)列出了其他课程,但还没有我们没有购买和享受过的课程。 因此,我们希望您也能喜欢它们!

另一门很棒的课程是12。 机器学习AZ™:动手处理Python和R数据科学 ..本课程是综合性的,讨论Python和R。这不仅是针对Scikit学习,而且是一般的机器学习。 此外,本课程的创建者是SuperDataScience.com的所有者。这是一个很棒的网站,提供播客,课程等信息。 因此,如果您不想为课程付费,则可以随时免费收听播客!
当然,Python并不是数据科学的唯一语言。 另一种流行的语言是R(而且,这不是唯一的两种语言,人们喜欢使用其他语言……除了Matlab ..我们不谈论Matlab)。

目前,python是每个人的语言。 它易于编写,实现和使用。 是否需要权衡,是的,它几乎可以满足您所需的一切吗?

我们希望该列表对您有所帮助。 请在下面用一些您喜欢的书或有关python的免费资源发表评论!

有关数据科学,SQL和Python的更多信息和视频,请访问:
如何开发鲁棒算法
将CSV数据动态批量插入SQL Server
SQL最佳实践—设计ETL —第1部分
算法如何变得不道德和偏见
数据科学家必须具备的4种技能
什么是决策树

From: https://hackernoon.com/learning-data-science-our-favorite-python-resources-from-free-to-not-877fca5c92f0