三分钟学会 Python 中文分词与词云绘制——以豆瓣《至爱梵高》影评为例
文章来源:企鹅号 - Datartisan数据工匠
学习完本节课程,你将学会如何将任意中文文本生成词云。
工具库与语料准备
首先,我们需要导入所需的工具库,并对jupyter notebook进行简单的设置:
接着,导入我们所用的语料集——1141条来自豆瓣网的《至爱梵高》影评
1141
我们的原始语料集数据如下所示:
上面的数据集包含了《至爱梵高》影评的诸多信息,下面我们将以影评内容( content 列)为分词与词云绘制的重点对象。
- 发表于:
- 原文链接:http://kuaibao.qq.com/s/20180202B05DGS00?refer=cp_1026
- 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
- 如有侵权,请联系 cloudcommunity@tencent.com 删除。