首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关于自然语言处理系列-聊天机器人之gensim

    Gensim是一个免费的 Python库,旨在处理原始的非结构化数字文本。...在Gensim的算法,比如Word2Vec,FastText,潜在语义分析(LSI,LSA,see LsiModel),隐含狄利克雷分布(LDA,见LdaModel)等算法,这些算法是无监督学习的。...一般情况下推进200-500维度,LSI可以增量训练 RpModel,随机投影(RP)旨在降低向量空间维数 LdaModel,LDA是另一个从词袋计数到低维主题空间的转换,是LSA的扩展,LDA的主题可以解释为单词上的概率分布...import corpora from gensim import similarities from gensim import models import pprint # Document -...- Gensim的文档,一般是字符串 # 不过英文词汇是靠空格天然分割的,通过split()分开即可 # 中文文档需要通过jieba和pkuseg进行分词预处理后,才等同于Gensim的文档 document_en

    1.6K20
    领券