《Python机器学习——数据分析与评分卡建模》学习笔记
第五章 自然语言处理案例——电商评论
需要使用missingno包预览缺失值。(最好都看完再进行操作)
开始直接pip install missingno命令安装不上,在Anaconda里也没法直接搜到相应的包。找了半天博客,百度,在github上找到相应的包,下载相应的文件:
网址:https://github.com/ResidentMario/missingno这个是别人写的包,解压后目录内容如下:
然后按照readme.md文件执行。我说一下我的运行过程:
开始运行里cmd命令,在解压后目录下运行pip install quilt这步好几次报错,说是pip版本不是最新的,可以根据提示命令更新,我这里因为电脑里装了几个python还有几个IDE工具,所以pip.exe不止一个,这里问题就不细说了。
然后运行quilt install ResidentMario/missingno_data本来以为终于好使了,结果在spyder里运行还是加载不了,只能运行missingno_data的相关内容:
我在cmd命令行里再pip一下就好使了!天啊,这个真是神奇的坑,也不知道为什么最开始pip install不好使。如果谁弄明白了希望能告诉我一声,谢谢。
书中86页删除缺失值部分col多加了一个[ ],这块也可以看视频,视频讲解是对的。df=df.dropna(subset=col) #删除缺失值