Python学习札记(附带anaconda安装和调试)
之前开发一直使用的语言是java,后来接触机器学习,也有很多开源的机器学习java版本算法,由于项目更倾向于机器学习源码,开始接触Python学习,以博客形式记录学习。
----------------------------------------------------------------------------------------------------------------
Python 简介
Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。
Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。
-----------------------------------------------------------------------------------------------------------------
Python 特点
1.易于学习:Python有相对较少的关键字,结构简单,和一个明确定义的语法,学习起来更加简单。
2.易于阅读:Python代码定义的更清晰。
3.易于维护:Python的成功在于它的源代码是相当容易维护的。
4.一个广泛的标准库:Python的最大的优势之一是丰富的库,跨平台的,在UNIX,Windows和Macintosh兼容很好。
5.互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测试和调试代码片断。
6.可移植:基于其开放源代码的特性,Python已经被移植(也就是使其工作)到许多平台。
7.可扩展:如果你需要一段运行很快的关键代码,或者是想要编写一些不愿开放的算法,你可以使用C或C++完成那部分程序,然后从你的Python程序中调用。
8.数据库:Python提供所有主要的商业数据库的接口。
9.GUI编程:Python支持GUI可以创建和移植到许多系统调用。
10.可嵌入: 你可以将Python嵌入到C/C++程序,让你的程序的用户获得"脚本化"的能力。
-----------------------------------------------------------------------------------------------------------------
Python下载
Python最新源码,二进制文档,新闻资讯等可以在Python的官网查看到:
Python官网:https://www.python.org/
你可以在以下链接中下载 Python 的文档,你可以下载 HTML、PDF 和 PostScript 等格式的文档。
Python文档下载地址:https://www.python.org/doc/
-----------------------------------------------------------------------------------------------------------------
Python安装
以下是各个平台安装包的下载地址:
Unix & Linux 平台安装 Python:
以下为在 Unix & Linux 平台上安装 Python 的简单步骤:
- 打开 WEB :https://www.python.org/downloads/source/
- 选择适用 于Unix/Linux 的源码压缩包。
- 下载及解压压缩包。
- 如果你需要自定义一些选项修改Modules/Setup
- 执行 ./configure 脚本
- make
- make install
执行以上操作后,Python 会安装在 /usr/local/bin 目录中,Python 库安装在 /usr/local/lib/pythonXX,XX 为你使用的 Python 的版本号。
Window 平台安装 Python
以下为在 Window 平台上安装 Python 的简单步骤:
打开 WEB :https://www.python.org/downloads/windows/
在下载列表中选择Window平台安装包,包格式为:python-XYZ.msi 文件 , XYZ 为你要安装的版本号。
要使用安装程序 python-XYZ.msi, Windows 系统必须支持 Microsoft Installer 2.0 搭配使用。只要保存安装文件到本地计算机,然后运行它,看看你的机器支持 MSI。Windows XP 和更高版本已经有 MSI,很多老机器也可以安装 MSI。
下载后,双击下载包,进入 Python 安装向导,安装非常简单,你只需要使用默认的设置一直点击"下一步"直到安装完成即可。
-----------------------------------------------------------------------------------------------------------------
环境变量配置
程序和可执行文件可以在许多目录,而这些路径很可能不在操作系统提供可执行文件的搜索路径中。
path(路径)存储在环境变量中,这是由操作系统维护的一个命名的字符串。这些变量包含可用的命令行解释器和其他程序的信息。
Unix或Windows中路径变量为PATH(UNIX区分大小写,Windows不区分大小写)。
在Mac OS中,安装程序过程中改变了python的安装路径。如果你需要在其他目录引用Python,你必须在path中添加Python目录。
在 Unix/Linux 设置环境变量
- 在 csh shell: 输入setenv PATH "$PATH:/usr/local/bin/python" , 按下"Enter"。
- 在 bash shell (Linux): 输入export PATH="$PATH:/usr/local/bin/python" ,按下"Enter"。
- 在 sh 或者 ksh shell: 输入PATH="$PATH:/usr/local/bin/python" , 按下"Enter"。
注意: /usr/local/bin/python 是 Python 的安装目录。
在 Windows 设置环境变量
在环境变量中添加Python目录:
在命令提示框中(cmd) : 输入path=%path%;C:\Python
注意: C:\Python 是Python的安装目录。
也可以通过计算机系统环境设置:在"Path",添加python安装路径即可(我的D:\Python32),所以在后面,添加该路径即可。
ps:记住,路径直接用分号";"隔开!
最后设置成功以后,在cmd命令行,输入命令"python",就可以有相关显示。
-----------------------------------------------------------------------------------------------------------------
比python软件更加好用的软件是:Anaconda(效果等同于包含数据科学常用包的 Python 发行版本)
Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。Anaconda利用工具/命令conda
来进行package和environment的管理,并且已经包含了Python和相关的配套工具。
conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理与环境管理。包管理与pip的使用类似,环境管理则允许用户方便地安装不同版本的python并可以快速切换。Anaconda则是一个打包的集合,里面预装好了conda、某个版本的python、众多packages、科学计算工具等等,所以也称为Python的一种发行版。其实还有Miniconda,顾名思义,它只包含最基本的内容——python与conda,以及相关的必须依赖项,对于空间要求严格的用户,Miniconda是一种选择。
conda的设计理念——conda将几乎所有的工具、第三方包都当做package对待,甚至包括python和conda自身!因此,conda打破了包管理与环境管理的约束,能非常方便地安装各种版本python、各种package并方便地切换。
-----------------------------------------------------------------------------------------------------------------
Anaconda的安装
Anaconda 可用于 Windows、Mac OS X 和 Linux,选择相应的版本进行下载
下载地址:https://www.anaconda.com/download/#download
第一个勾是是否把Anaconda加入环境变量,这涉及到能否直接在cmd中使用conda、jupyter、ipython等命令,推荐打勾,如果不打勾话问题也不大,可以在之后使用Anaconda提供的命令行工具进行操作;第二个是是否设置Anaconda所带的Python 3.6为系统默认的Python版本,这个自己看着办,问题不大。
第二个钩也勾上。一路安装完成以后,就可以打开cmd测试一下安装结果。
-----------------------------------------------------------------------------------------------------------------
添加环境变量
添加Anaconda路径至系统环境变量“path”,记得分号隔开。
-----------------------------------------------------------------------------------------------------------------
Anaconda测试
命令行窗口,分别输入python、ipython、conda、jupyter notebook等命令,会看到相应的结果,说明安装成功。(python是进入python交互命令行;ipython是进入ipython交互命令行,很强大;conda是Anaconda的配置命令;jupyter notebook则会启动Web端的ipython notebook)
Anaconda安装成功之后,我们需要修改其包管理镜像为国内源。
1. 首先Anaconda提供了命令行工具 Anaconda Prompt,在左下角菜单中可以找到该工具,双击打开,就能像cmd一样使用anaconda的命令啦。
2. 执行以下指令:
# 添加Anaconda的TUNA镜像: conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
# 设置搜索时显示通道地址: conda config --set show_channel_urls yes
为了避免报错,我推荐在默认环境下更新所有的包。打开 Anaconda Prompt (或者 Mac 下的终端),键入:conda upgrade --all
备注:并在提示是否更新的时候输入 y(Yes)以便让更新继续。初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。
查看镜像:
查看conda的配置,一般在当前用户路径下,比如C:\Users\Administrator\.condarc .condarc具体内容如下:
channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: true
-----------------------------------------------------------------------------------------------------------------
管理包
安装了 Anaconda 之后,管理包是相当简单的。要安装包,请在终端中键入 conda install package_name
。
例如,要安装 numpy,请键入 conda install numpy
。
你还可以同时安装多个包。类似 conda install numpy scipy pandas
的命令会同时安装所有这些包。还可以通过添加版本号(例如 conda install numpy=1.10
)来指定所需的包版本。
Conda 还会自动为你安装依赖项。例如,scipy
依赖于 numpy
,因为它使用并需要 numpy
。如果你只安装 scipy
(conda install scipy
),则 conda 还会安装 numpy
(如果尚未安装的话)。
大多数命令都是很直观的。要卸载包,请使用 conda remove package_name
。要更新包,请使用 conda update package_name
。如果想更新环境中的所有包(这样做常常很有用),请使用 conda update --all
。最后,要列出已安装的包,请使用前面提过的 conda list
。
如果不知道要找的包的确切名称,可以尝试使用 conda search search_term
进行搜索。例如,我知道我想安装 Beautiful Soup,但我不清楚确切的包名称。因此,我尝试执行 conda search beautifulsoup
。
搜索 beautifulsoup,它返回可用的 Beautiful Soup 包的列表,并列出了相应的包名称 beautifulsoup4
。
管理环境
如前所述,你可以使用 conda 创建环境以隔离项目。要创建环境,请在终端中使用 conda create -n env_name list of packages
。在这里,-n env_name
设置环境的名称(-n
是指名称),而 list of packages
是要安装在环境中的包的列表。例如,要创建名为 my_env
的环境并在其中安装 numpy,请键入 conda create -n my_env numpy
。
列出环境
如果忘记了环境的名称(我有时会这样),可以使用 conda env list
列出你创建的所有环境。你会看到环境的列表,而且你当前所在环境的旁边会有一个星号。默认的环境(即当你不在选定环境中时使用的环境)名为 root
。
删除环境
如果你不再使用某些环境,可以使用 conda env remove -n env_name
删除指定的环境(在这里名为 env_name
)。
使用环境
对我帮助很大的一点是,我的 Python 2 和 Python 3 具有独立的环境。我使用了 conda create -n py2 python=2
和 conda create -n py3 python=3
创建两个独立的环境,即 py2
和 py3
。现在,我的每个 Python 版本都有一个通用环境。在所有这些环境中,我都安装了大多数标准的数据科学包(numpy、scipy、pandas 等)。
共享环境
在 GitHub 上共享代码时,最好同样创建环境文件并将其包括在代码库中。这能让其他人更轻松地安装你的代码的所有依赖项。对于不使用 conda 的用户,我通常还会使用 pip freeze
,将一个 pip requirements.txt
文件导出并包括在其中。