小编就对最近做的一个项目,影评分析进行一下总结。
我们知道一般电影评价分为好和坏,但是我们得到是一段文字,我们需要将文字转换为词向量,于是tfidf就派上用场了,下面我就来介绍一下关于tfidf,当然百度上也有很多好的资料小编推荐一些。https://www.cnblogs.com/chenbjin/p/3851165.html
http://blog.csdn.net/liuxuejiang158blog/article/details/31360765
这两篇文章是非常好的。
你也可以自己打一下看看区别,第一列是文档id第二例是word_id如(0,5)是第0篇文档中id为5的词(这个id是在词典中的id,整个语料库统一编号)这个语聊指的是你fit的语聊库。通过tfidf之后就简单了,调用sklearn的库就可以了
这里特别感谢木豆老师提供的资料,和他认真的教学态度,如果你想听木豆老师的课,可以点击阅读原文。
领取专属 10元无门槛券
私享最新 技术干货