爱情公寓大电影上映一天,口碑褒贬不一,按捺不住躁动的心情,果断采用python爬虫技术从豆瓣https://movie.douban.com中,爬取420条评论。对评论进行jieba中文分词,然后将分词的结果可视化到词云中。一个人的评价可能片面,但当大量评论数据将共性的问题展示出来后,就能切实展现出这部电影是否值得观看了。
首先爬取评论信息。
表1 python爬虫代码
图1 监控爬取评论动态
其次,进行python词云显示,其中包含了jieba分词。
表2 python词云代码
图2 词云背景图
图3 爱情公寓词云分析结果
纵观百位网友的评论,果断差评呀,又节省了一笔钱。
领取专属 10元无门槛券
私享最新 技术干货