首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

今天掌握SnowNLP好不好

跟着博主的脚步,每天进步一点点

本文简绍了SnowNLP的使用方法,这是一个处理中文文本内容的python类库,其主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。

简介

SnowNLP是一个可以方便的处理中文文本内容的python类库,是受到了TextBlob的启发而写的,和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。

SnowNLP主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。

Github地址:https://github.com/isnowfy/snownlp

实战

1.安装

2.分词

3.词性标注

4.情感分析(positive的概率)

5.中文拼音

6.繁体转简体

7.分割成句子(Tokenization)

8.关键词抽取

9.摘要抽取

10.计算tf和idf

11.计算相似度(BM25)

12.支持训练

代码已上传:

https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/SnowNlpDemo.ipynb

The End

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190506A01DLR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券