利用python对《乘风破浪的姐姐》的媒体评论做词云分析

利用python对《乘风破浪的姐姐》的媒体评论做词云分析

《乘风破浪的姐姐》实属今年夏天最热门也是最引发热议的综艺节目了,吸引了无数观众的观看。
词云,即对网络文本中出现频率较高的“关键词”予以视觉上直观的突出,让人一眼领会文本的大致内容。
接下来,我将用python对网上关于《乘风破浪的姐姐》的媒体评论做词云分析。首先我将网上的媒体评论以纯文本格式粘贴在记事本中。
利用python对《乘风破浪的姐姐》的媒体评论做词云分析
打开pycharm,先引入需要的库,没有所需要的库的提前安装(eg. pip install jieba) 。其中,jieba是用于中文分词的库,wordcloud自然是词云用到的库。
利用python对《乘风破浪的姐姐》的媒体评论做词云分析
这一部分是读入文本和jieba分词的过程。
利用python对《乘风破浪的姐姐》的媒体评论做词云分析
接下来是词云的过程,在运行中发现出现大量的连接词、数量词和助词,故提前把这些词从用于生成词云的列表中去掉。
利用python对《乘风破浪的姐姐》的媒体评论做词云分析
最终生成的结果如下:
利用python对《乘风破浪的姐姐》的媒体评论做词云分析
可以看出,评论对完全由现场观众打分的机制提出了质疑和吐槽。