深度学习环境配置(二)- Anaconda安装

Taihua 于 2020-04-13 发布

上一篇 深度学习环境配置(一)- CUDA安装 ,讲了显卡加速必须安装的CUDA如何配置。

接下来,介绍一下如何安装Anaconda。

Anaconda是一个预装了很多我们用得到或用不到的第三方库的Python开源发行版本,主要面向科学计算。目前,Anaconda和Jupyter notebook已成为数据分析的标准环境。Anaconda是Python的包管理器和环境管理器,Jupyter notebook可以将数据分析的代码、图像和文档全部组合到一个web文档中。

利用Anaconda,我们可以便捷获取Python库且对库能够进行管理,同时对环境进行统一管理。为什么需要管理库和环境呢?比如你安装某个库,它需要依赖其他库才能发挥作用,通过Anaconda自带的pip或者conda命令来安装,就能为你自动安装依赖的库,大大提升了第三方库的安装成功率。另外,如果在A项目中用了Python 2,而新的项目B要求使用Python 3,而同时安装两个Python版本可能会造成许多混乱和错误。这时候 conda就可以帮助你为不同的项目建立不同的运行环境。

除此之外,Anaconda丰富的数据分析包为我们进行研究提供了很大的便利。如果日常工作或学习并不必要使用1000多个库,那么可以考虑安装Miniconda,这里不过多介绍Miniconda的安装及使用。

今天我们主要介绍如何在Win 10系统上安装和使用Anaconda。由于不同系统可能存在不一样的情况,以下方法只在我的电脑环境下尝试过:

系统:Win10 64位
显卡:NVIDIA GTX 1060 CUDA 10.2
Anaconda 3
Python 3.7

1. 安装Anaconda

首先打开Anaconda官网下载自己电脑系统适用的Anaconda安装包,与Python的版本相对应,Anaconda的版本分为Anaconda 2和Anaconda 3。我选择的Anaconda 3,所以安装之后电脑里面的Python是3.7版本的,大家可以自行下载平时习惯用的版本,提供32位和64位下载。


ana.jpg

因为众所周知的原因,如果真的去官网下载Anaconda的话会发现,速度慢到令人发指,500多兆的文件很有可能当你等待了30多分钟下载中断。所以这里推荐去清华大学开源软件镜像站进行下载,有时候镜像站也很慢,也可以自行百度阿里镜像或者中科大镜像。

下载完成后,点击打开Anaconda3-2020.02-Windows-x86_64.exe开始安装,一路选择NEXT。


1.png
2.png

但是有一些需要注意的,不然后面会坑的找不着北。


3.png

在上面这个界面,Install for: Just me还是All Users,Just me指只有当前用户可以使用Anaconda,电脑内其他用户就没法使用了。假如你的电脑有好几个Users ,都需要用到Anaconda,就必须选择All Users,二者其实没太大区别。

但注意:最开始我选的Just me,Anaconda会被安装到“C:\Users\ 用户名”文件夹内。由于我的用户名里面有中文,因为路径编码的问题,后面会有很多坑,例如conda整个就没法用,无法创建环境,环境内安装第三方库等。所以建议如果选择Just me,用户名内千万不能出现中文。另外,网上出现很多问题是由于Anaconda安装路径出现空格导致的。所以记住,安装路径不能出现中文和空格。


4.png

经过了很多次坑之后,我现在都会选择如果选择All Users,默认安装到“C:\ProgramData”目录下,没有空格没有中文,避免了很多坑。


5.png

接下来,在上图这个界面,第一个勾选择是否把Anaconda加入环境变量,这涉及到能否直接在cmd中使用conda、jupyter、ipython等命令,推荐打勾,不然自己配置环境变量也很麻烦。第二个选择是否设置Anaconda所带的Python设置为系统默认的Python版本,这个自己看着办。整个过程还是很漫长的,总共差不多2.6GB的无数个小文件,请耐心等待。


6.png

显示上图界面安装完成后,我前几次安装的Anaconda里自带的那些软件,如Spyder、Anaconda Navigator都会报错。找了很久,最后根据这篇博客,原因好像是有个平台支持的组件出的问题,应该将Anaconda安装目录下的“C:\ProgramData\Anaconda3\Library\plugins\platforms”文件夹复制出来,放到根目录“C:\ProgramData\Anaconda3”下。但最近一次安装的最新版没出现这个问题,spyder还不需要自己汉化,打开就跟随系统语言了。可能是官方解决了这个问题,但如果碰到上述问题不妨试一下以上方法。

注意:Spyder如果提示需要更新,不要用pip,会破坏库的完整性。

打开cmd测试一下安装结果,分别输入python、ipython、conda、jupyter notebook等命令,会看到相应的结果,说明安装成功。(python是进入python交互命令行;ipython是进入ipython交互命令行,很强大;conda是Anaconda的配置命令;jupyter notebook则会启动Web端的ipython notebook)


下面来简单看一看Anaconda自带的一些软件:


ana5.jpg

2. Anaconda Navigator

Anaconda Navigator,是用于管理工具包和环境的桌面图形用户界面(GUI),后续涉及的众多管理conda包,环境和通道的功能都可以在Navigator中手动点击实现。


nv1.jpg

上图中,圈出的Spyder、Jupyter notebook等软件是Anaconda自带的,其他的是我在Anaconda Navigator手动点击安装的。


nv2.jpg

上图是Navigator管理环境,安装、删除库的界面。

3. Anaconda Prompt

Anaconda Prompt是Anaconda的一个终端。打开Anaconda Prompt(Anaconda Powershell Prompt功能类似,都是命令终端),这个窗口和cmd窗口一样,输入命令就可以控制和配置python。最常用的是conda命令,点开的话如下图,用命令“conda list”查看已安装的包,从这些库中我们可以发现NumPy,SciPy,Matplotlib,Pandas等数据科学常用的库。


pro1.jpg

4. Spyder

Spyder是一个使用Python语言、跨平台的、科学运算集成开发环境。Spyder编辑器,可以用来编写、调试和运行Python代码,它最大优点就是模仿MATLAB的“工作空间”。


spd.jpg

5. Glueviz

Glue是一个Python库,用于探索相关数据集内部和之间的关系。其主要特点包括:


glu.jpg

6. Orange3

Orange3,交互式数据可视化库,通过巧妙的数据可视化执行简单的数据分析。探索统计分布,箱形图和散点图,或深入了解决策树,层次聚类,热图,MDS和线性投影。即使您的数据是多维的,也可以在2D中变得合理,特别是在智能属性排名和选择方面。


ora.jpg

7. Jupyter notebook

Jupyter notebook是基于web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。后面配置好深度学习环境之后会专门讲Jupyter notebook的使用。

其他Anaconda里没用过的功能,大家感兴趣的话可以自行探索。



参考资料:
Raxxie:Anaconda介绍、安装及使用教程
猴子:初学 Python 者自学 Anaconda 的正确姿势是什么?
段小草:最省心的Python版本和第三方库管理——初探Anaconda
代码帮:Anaconda详细安装及使用教程(带图文)