Anaconda3安装jieba分词和wordcloud词云组件(2020.2.6)
前言
jieba是优秀的中文分词第三方库,安装后可以使用其来对中文文本进行分词。而wordcloud,见名知意“词云”,wordcloud是基于Python的词云生成类库,以词语为基本单位,更加直观艺术的展示文本。由wordcloud这个构造特点,所以jieba和wordcloud是一个常见的组合关系,用以展示精简地文本,下面来说一下它们的安装步骤。
一、安装jieba分词库
github上的jieba说明,链接
这里有个小插曲,我起初以为可以conda install jieba
,然而没有用,后面又看到有博文介绍到使用conda install -c conda-forge jieba
可以安装,然而还是不行,这时报错的是CondaHTTPError: HTTP 000 CONNECTION FAILED for url。下面我讲的是半自动安装,按步骤来即可。
(一)第一步、下载安装包
官网https://pypi.org/project/jieba/0.39/#files下载。
建议使用迅雷下载,速度加快。
这里我下的是windows的0.39版本,而0.4以上版本均为linux的tar文件。
将下载好后的解压文件放在Anaconda下的 pkgs 目录下。
(二)第二步,运行setup.py
打开cmd窗口,cd命令切换到jieba的目录下,输入python setup.py install
回车即可,最后conda list
看看是否安装成功。
如果如下图所示,恭喜jieba安装成功。
二、安装wordcloud词云库
同样的无法使用conda install的方式安装,所以wordcloud和jieba库的安装方法相同。
注意:wordcloud的版本比较多,要对应好自己的python版本及系统版本。后面细讲,提前说明一下,怕有人手太快了,多走冤枉路。
(一)第一步、下载安装包
官网https://pypi.org/project/wordcloud/#files下载。
如下图,每个安装包大体都有这三个信息,给你们标注好了,找对自己合适的安装包下载,python版本可以在cmd中输入python -V
查看。
将下载好的文件放在Anaconda下的 pkgs 目录下。
(二)第二步、输入指令安装
打开cmd窗口,cd命令切换到pkgs目录下,输入pip install wordcloud-1.6.0-cp37-cp37m-win_amd64.whl
后回车。
这个install后跟的要是自己的安装包名,可不要大意,给个小Tips,你在cmd里输入一个w,接着按一下tab键会自动补全名称。
看到这个就说明wordcloud库安装成功了。
最后
我最近刚写了一个爬微博”战疫情“信息的爬虫,刚好是个文本,用这个文本来看看效果。
这里仅为jieba和word库最简单的使用方法,像里面有个"全文"两字太扎眼了,需要添加代码修改一下。
但是在这个词云图里还是可以看出大家对武汉的关注,对疫情的关注,当然还有大家对这口罩种种的表达,最后想说一句“加油,我们有个强大的祖国,一切都会过去的,加油!!!”。