lda的python_python lda_lda python - 腾讯云开发者社区

、

jupyter笔记本无法从dirichlet_likelihood.py中导入lda2vec。这个py文件存在于当前lda2vec的github中。我安装了模块，打开了工作簿，然后尝试运行它。我怀疑我的问题有一个很简单的原因。笔记本是当我在python命令行(在当前环境中)尝试下面的内容时，它不会给出下面的错误，而是需要我安装的keras。在命令行上，它说它不能导入预处理。 uname -a Linux ubuntu 4.18.0-15-generic #16~18.04.1-Ubuntu SMP Thu Feb 7 14:06:04 UTC 2019 x86_64 x86_64 x8

浏览 1提问于2019-09-11得票数 2

1回答

使用Gensim或其他python LDA包来使用来自Mallet的经过训练的LDA模型

、、

我有一个在Java中通过Mallet训练的LDA模型。从Mallet LDA模型生成了三个文件，这允许我从文件运行模型并推断新文本的主题分布。现在，我想实现一个Python工具，它能够根据经过训练的LDA模型，在给定新文本的情况下推断主题分布。我不想在Python中重新训练LDA模型。因此，我想知道是否可以将经过训练的Mallet LDA模型加载到Gensim或任何其他python LDA包中。如果是这样，我该怎么做呢？感谢您的回复或评论。

浏览 18提问于2017-05-04得票数 5

1回答

用python编写的LDA算法代码不是很清楚

、

我正在尝试使用python和Gensim实现潜在的Dirichlet分配( LDA )，我也引用了一个网站上的LDA代码，但我仍然不是很清楚LDA的python代码。谁知道LDA的人可以向我解释清楚的方式，根据代码如下所示。我还上传了LDA公式，这是维基百科上的一张图片。在本例中，LDA用于分析文本文档的集合。 lda_model = gensim.models.ldamodel.LdaModel(corpus=corpus, id2word=id2word,

浏览 18提问于2019-04-02得票数 3

回答已采纳

1回答

带有Python的LDA -输入文件

、、

我正在用Python运行lda库，并且我正在运行这个示例。有人知道X、Does和title的格式吗？我找不到文档。 import numpy as np import lda X = lda.datasets.load_reuters() vocab = lda.datasets.load_reuters_vocab() titles = lda.datasets.load_reuters_titles()

浏览 2提问于2015-05-19得票数 3

1回答

用于计算机视觉的Python中的LDA

、、、

我正在使用LDA(隐狄利克雷分配)主题建模进行基于内容的图像检索。我也希望使用Python来做同样的事情。我在Python for LDA for image dataset中找不到任何库/包，包似乎只适用于文本语料库。请在Python中为图像语料库推荐任何软件包，或简要列出执行图像LDA所需的步骤。

浏览 6提问于2017-03-07得票数 0

1回答

CythonGSL/通过Cython在Windows上使用GSL

、、、

机器配置：Machine是windows 7 x64，安装了python2.7和cython0.18(全部为64位)。我还安装了MS C++ 2008 Visual。我有GSL二进制文件，路径指向GSL\Bin。我正在使用MS 2008 +SDK7.0编译cython .pyx文件。我使用SDK7.0命令提示符来编译为c和cython。 Problem但是在编译时我得到了一个链接错误2019年，它表示没有找到GSL文件夹中的头文件。我的尝试解决这个我下载的CythonGSL。使用"from cythonGSL cimport *“不起作用。我访问了这个包的init文件，并更改了它

浏览 3提问于2013-04-09得票数 1

回答已采纳

1回答

如何自动编译python/c扩展？

、

我编写了一个python/c扩展文件lda_model.c 我添加了setup.py： from setuptools import setup, Extension modules = [Extension('c_lda_model', sources=["lda_model.c"])] setup(ext_modules=modules) 现在我必须编译C代码 python setup.py build 在运行python代码之前，调用C代码。有没有任何方法可以自动编译被调用的C扩展，在运行python代码的时候？

浏览 0提问于2014-08-20得票数 1

1回答

在python中使用C++库使用ctype

、、

我有一个C++库，它提供了用于管理数据的各种类。我有这个库的源代码。我正在尝试使用ctype从python中调用这个库的lda.cpp函数。此函数反过来使用库中所有其他.cpp文件中的函数。 //lda.cpp #include "model.h" #include <stdio.h> #include "lda.h" int lda_est(double alpha, double beta) { model lda; if (lda.model_est(alpha, beta)) { return 1;

浏览 0提问于2016-01-21得票数 0

1回答

将gensim LDA模型保存到s3

、、

我已经通过使用gensim得到了一个LDA模型。我可以将其保存在本地： ldamodel.save('models/lda/lda.model') 这将在指定位置生成四个文件： lda.model lda.model.expElogbeta.npy lda.model.id2word lda.model.state 重新加载它们就像下面这样简单 ldamodel = models.LdaModel.load('models/lda/lda.model') 但是，我希望将此模型保存在s3上。我可以计算出如何保存单个比特，例如： s3.meta.client.up

浏览 12提问于2020-05-06得票数 0

回答已采纳

1回答

无法在python中创建REST服务

、、

我想创建一个REST服务，所以我尝试了一下，下面是我的代码片段 from bottle import route, run @route('/plot_graph',method='GET') def plot_graph(): #compute graph_list (python object of type list) #done return graph_list if __name__ == "__main__": run(host='0.0.0.0', port=8881, serv

浏览 6提问于2016-08-07得票数 2

回答已采纳

1回答

LDA2Vec实现示例？

、、、

嗨，谁能帮我介绍一下使用python的LDA2Vec工作示例吗？请假定dataframe df有包含文本数据的列"Notes“。我正在尝试实现"cemoody/lda2vec“github示例，但得到了多个问题-- 1.如何安装spacy包? 2. ImportError:无法从'lda2vec‘3导入名称'preprocess’。ImportError:无法从'LDA2Vec‘导入名称'lda2vec’。不知道我在这里错过了什么。任何帮助/链接都将是非常感谢的。

浏览 2提问于2019-05-08得票数 5

1回答

如何改进gensim的主题模型

、、

我想从文章中提取主题，测试文章是"“。这是关于巨蟒和剥落的。我试过lsi和lda，大多数时候，lda似乎更有效。但两者的产出并不稳定。当然，前三或五个关键词似乎击中了目标。"python"，"book"，'project‘(我不认为’项目‘应该是一个有用的话题，并将其放在停止词列表中。)、缩放或可伸缩或openstack应该在关键字列表中，但根本不稳定。 “主题列表”和“停止列表”可能会改善结果，但它是不可伸缩的。我必须为不同的领域维护不同的列表。那么，这里的问题是，是否有更好的解决方案来改进算法？ num_topics = 1 num_w

浏览 2提问于2017-06-17得票数 0

回答已采纳

1回答

Python不能从命令行运行模块；IPython可以

、

下面是我的模块的目录结构：可以看出，DataProcessor是一个模块，DataLoader在其中具有特定的功能。在lda模块内部，文件HFT.py包含来自DataProcessor导入DataLoader的行我正在尝试从主目录274-Yelp/运行lda/HFT.py python lda/HFT.py 这会产生以下错误： Traceback (most recent call last): File "lda/HFT.py", line 6, in <module> from DataProcessor import DataLoader I

浏览 2提问于2016-06-08得票数 2

1回答

最高数的LMC循环和多少个数(N =) (Max=)

、、

我正在尝试实现一个循环，该循环接受用户愿意输入的数字，然后打印出其中最大的一个，如Max = highest number和N = total number of inputs。当输入为0时，程序应该停止这就是我到目前为止所做的，但是N和Max没有打印出来？ LOOP INP BRZ F STA first BRA LOOP LOOP INP BRZ F STA second BRA LOOP SUB second BRP secondBig

浏览 1提问于2018-10-18得票数 0

回答已采纳

1回答

LatentDirichletAllocation巨蟒

、、

我通过python库的scikit为LatentDirichletAllocation使用了以下代码： tf_vectorizer = CountVectorizer(max_df=0.95, min_df=2, stop_words='english') tf = tf_vectorizer.fit_transform(documents) lda_model = LatentDirichletAllocation(n_components=10, max_iter=5, learning_method='online', learning_offset=

浏览 31提问于2018-05-28得票数 0

回答已采纳

1回答

为每个主题添加单词LDA

、、、、

我正在使用Gensim在python中构建一个LDA，我正在努力增加每个主题的打印字数，从默认的10个。我想要20个主题，每个主题30个单词。我们将非常感谢您的任何建议:) # train the LDA model lda_model = gensim.models.LdaMulticore(bow_corpus, num_topics=20, id2word=dictionary, passes=2, workers=2) # check out the topics for idx, topic in lda_model.print_topics(-1): print(&#

浏览 22提问于2019-03-19得票数 0

回答已采纳

1回答

安装软件包lda和pyprind

、、、

我在Anaconda2.3.0的木星上使用Python 3。我已经安装了LDA (潜在的Dirichlet ) 和pyprind使用pip install lda和pip install pyprind。安装似乎是成功的，但是当我尝试使用木星的import lda和improt pyprind时，它会显示错误消息。 --------------------------------------------------------------------------- ImportError Traceback (most r

浏览 6提问于2016-12-16得票数 0

回答已采纳

2回答

如何在应用LDA后自动标注主题

、、、、

我已经在python.now中实现了LDA，我想标记我从LDA得到的任何主题。 [(0, u'0.023*"alternate" + 0.023*"transfervisions" + 0.013*"tvcommunity"'), (1, u'0.026*"minimalism" + 0.026*"minimalist" + 0.018*"honking"'), (2, u'0.027*"videomaking" + 0.019*"py

浏览 3提问于2017-10-06得票数 2

1回答

在gunicorn上部署烧瓶应用程序，模块对象没有属性。

、、

我正在尝试将我的水瓶应用程序部署到gunicorn，并且我得到了以下错误。 AttributeError: 'module' object has no attribute 'MyTopics' 当我简单地运行服务器(即Flask服务器)时，一切都很好： python http_server/server.py 但是当我在火奴制下运行它的时候，我就得到了AttributeError gunicorn -c http_server.config http_server.server:app 加载我的服务器应用程序如下所示： import logging impor

浏览 2提问于2015-06-09得票数 4

回答已采纳

3回答

主题分布:在python中进行LDA后，我们如何查看哪个文档属于哪个主题？

、、、

我能够从gensim运行LDA代码，并获得前10个主题及其各自的关键字。现在，我想进一步看看LDA算法有多准确，通过查看它们聚集在每个主题中的文档。在gensim LDA中这是可能的吗？基本上，我想做这样的事情，但使用python和gensim。

浏览 1提问于2014-01-08得票数 30

回答已采纳

1回答

基于SVM的分类

、、、、

为了对文本进行分类，我想使用支持向量机。我想将测试数据分类为一个标签(健康/成人)，培训和测试数据是文本文件。我在使用python的scikit库。当我将文本保存到txt文件时，我用utf-8对其进行了编码，这就是为什么我要在代码片段中对它们进行解码。这是我尝试的代码 String = String.decode('utf-8') String2 = String2.decode('utf-8') bigram_vectorizer = CountVectorizer(ngram_range=(1, 2),

浏览 0提问于2016-07-27得票数 0

回答已采纳

2回答

C和Python中特征向量例程的不同结果

、、、、

所以我注意到，对于所有1s的4x4矩阵，我得到了不同的答案。在Python中使用：numpy.linalg.eig: matrix = numpy.ones((M,M), dtype=float); values, vectors = numpy.linalg.eig(matrix); Python结果： V1: [-0.866025 +0.288675 +0.288675 +0.288675] V2: [+0.500000 +0.500000 +0.500000 +0.500000] V3: [+0.391955 +0.597433 -0.494694 -0.494694] V4: [+0

浏览 2提问于2016-12-28得票数 4

1回答

如何让CUDNN在实例上使用lda2vec？

、、、

正如这里所述，我一直在尝试使用lda2vec来处理GPU。 http://nbviewer.jupyter.org/github/cemoody/lda2vec/blob/master/examples/twenty_newsgroups/lda.ipynb#topic=5&lambda=0.6&term= 我已经成功地安装了CUDA、Chainer (1.6.0)和CUDNN，但是当我以GPU作为True运行这个程序时，我得到以下信息： --------------------------------------------------------------------

浏览 3提问于2016-03-09得票数 0

回答已采纳

1回答

将pyLDAvis图形导出为pdf

、、、

我正在用Python进行LDA主题建模，下面是我的可视化代码： import pyLDAvis.gensim pyLDAvis.enable_notebook() vis = pyLDAvis.gensim.prepare(lda_model, corpus, dictionary=lda_model.id2word) vis 我正在寻找一种方法来导出到pdf或至少使用matplotlib绘图，然后保存为PDF的方法，有什么想法吗？

浏览 55提问于2020-08-12得票数 3

1回答

如何在一个文本文档上运行标记为LDA的文档？

、、、

我有200 K的tweet，我已经使用Gensim python库应用了LDA (潜在的Dirichlet分配)算法。现在我需要对他们申请标记/监督的LDA。有谁能帮我完成我应该遵循的任务。否则，如果您能为我提供另一个python库，我将感激不尽。

浏览 0提问于2016-07-12得票数 4

1回答

使用LDA主题模型作为分类模型输入

、、

我使用大的训练数据集制作LDA模型来制作主题模型。因此，我尝试使用这个LDA模型来对训练数据集中没有使用的新句子进行分类。如何使用新的输入句子找到最接近的主题编号？我应该使用LDA主题模型作为分类模型输入吗？欢迎使用Python分享示例代码。

浏览 4提问于2019-12-05得票数 0

1回答

LDA意外选择的功能数量

、

我试图执行LDA (线性鉴别分析)，以执行降维(从532特征)到我的数据集(features，一个1360x532矩阵)。 lda = LinearDiscriminantAnalysis(n_components=80) features = lda.fit(features, target).transform(features) print("[STATUS] LDA performed") print("[STATUS] feature vector size {}".format(np.array(features).shape)) 我编写了这段代码，

浏览 0提问于2019-01-23得票数 0

回答已采纳

1回答

Opencv python中的LDA

、、、

在OpenCV 2中，我们如何执行LDA分析？我可以看到C++文档，但在Python语言中似乎什么也没有。 http://docs.opencv.org/trunk/db/d59/classcv_1_1LDA.html

浏览 2提问于2016-12-23得票数 1

1回答

LDA Gensim Mallet将alpha设置为“auto”

、、

在Python.Gensim实现中，我使用LDA进行主题建模，允许我们将alpha设置为'auto‘，如下所示： alpha ({numpy.ndarray, str}, optional) – ’asymmetric’: Uses a fixed normalized asymmetric prior of 1.0 / topicno. ’auto’: Learns an asymmetric prior from the corpus (not available if distributed==True). 对于

浏览 2提问于2020-07-29得票数 1

回答已采纳

1回答

无折叠gibbs采样的引导式LDA

、、、、

我使用的是python包Guided LDA和折叠的gibbs采样[more details]。但我想要无折叠gibbs采样的引导LDA。如何分离引导LDA和折叠gibbs采样，或者如何在没有折叠gibbs采样的情况下获得结果？ model = guidedlda.GuidedLDA(n_topics=5, n_iter=100, random_state=7, refresh=20) model.fit(X, seed_topics=seed_topics, seed_confidence=0.15)

浏览 14提问于2020-04-20得票数 0

2回答

我应该使用哪个gensim语料库类来加载一个LDA转换的语料库？- Python

、、、、

如何从python的gensim 加载LDA转换的语料库： from gensim import corpora, models import numpy.random numpy.random.seed(10) doc0 = [(0, 1), (1, 1)] doc1 = [(0,1)] doc2 = [(0, 1), (1, 1)] doc3 = [(0, 3), (1, 1)] corpus = [doc0,doc1,doc2,doc3] dictionary = corpora.Dictionary(corpus) tfidf = models.TfidfModel(corpus

浏览 1提问于2013-03-03得票数 4

回答已采纳

1回答

使用lambda的Python3语法错误

、

我收到了一个语法错误，下面是一个教程。感觉就像Python3getcha。提前谢谢你！ def lda_description(review_text, min_topic_freq=0.05): """ accept the original text of a review and (1) parse it with spaCy, (2) apply text pre-processing steps, (3) create a bag-of-words representation, (4) create an LDA representation, and (5

浏览 2提问于2017-09-09得票数 1

回答已采纳

1回答

插入不一致的MySQL？

、、、

在ubuntu..。运行MySQL v5.6。创建了一个执行我所有操作的python程序。我的应用程序动态地创建表。有很多种。有些非常相似..。例如，这里有两个： create table tst.intgn_party_test_load ( party_id bigint unsigned NOT NULL, party_supertype varchar(15) NOT NULL, carrier_party_id bigint unsigned NOT NULL, full_name varchar(500), lda_actv_ind integer, ld

浏览 0提问于2021-02-02得票数 0

2回答

主题建模: LDA vs LSA vs ToPMine

、、、

我刚开始学习主题建模。可以用Python实现ToPMine吗？在快速搜索中，我似乎找不到任何带有ToPMine的package。 ToPMine比LDA和LSA好吗？我知道LDA和LSA已经存在了很长时间，并且得到了广泛的应用。谢谢

浏览 0提问于2022-01-20得票数 2

回答已采纳

1回答

TypeError：“浮点”和“NoneType”的实例之间float>不支持

、、

我使用gensim库训练了一个LDA模型，并使用它提取文档的主题向量，并使用以下代码 def clean_doc(data_string): global en_stop tokenizer = RegexpTokenizer(r'\w+') #Create appropriate tokenizer p_stemmer = PorterStemmer() #Create object from Porter Stemmer #clean and tokenize document string raw = data_string

浏览 1提问于2018-03-27得票数 0

回答已采纳

1回答

线性判别分析技巧

、、、

我在dataset上运行LDA，所有指标的结果都很好。然而，我似乎不能像PCA那样提取最高级的特性或加载。当使用sklearn python3时，是否有人熟悉从LDA中提取顶级特性/加载？

浏览 1提问于2022-02-24得票数 0

4回答

每次我在同一个语料库上训练时，LDA模型都会产生不同的主题。

、、、、

我使用python gensim从231个句子的小语料库中训练一个潜在的Dirichlet分配(LDA)模型。然而，每次我重复这个过程，都会产生不同的主题。为什么每次都使用相同的LDA参数和语料库生成不同的主题？和如何稳定主题生成？我正在使用这个语料库()和这个停止词列表()，下面是我的代码： from gensim import corpora, models, similarities from gensim.models import hdpmodel, ldamodel from itertools import izip from collections import defa

浏览 4提问于2013-02-25得票数 18

回答已采纳

0回答

Spark:将Scala ML模型加载到PySpark

、、、

我用scala Spark训练了一个LDA模型。 val lda = new LDA().setK(k).setMaxIter(iter).setFeaturesCol(colnames).fit(data) lda.save(path) 我检查了我保存的模型，它包含两个文件夹: metadata和data。然而，当我试图将这个模型加载到PySpark中时，我得到了一个错误消息： model = LDAModel.load(sc, path = path) File "/Users/hongbowang/spark-2.2.0-bin-hadoop2.7/python/lib

浏览 0提问于2017-12-03得票数 2

回答已采纳

1回答

用LDA模型获取Python样本外文档的主题权重

、

我正在使用Python ()中的LDA来获取一组文档的主题。我能够为我用来训练模型的文件获取主题和它们的权重。是否有方法将模型应用于在估计LDA时未包括的文档？例如，如果我使用文档1-100来估计主题，我是否可以将模型应用于文档101-200以获得这些样本外文档的主题权重？对于我正在使用的LDA python包，这有可能吗？如果您单击我上面提供的链接，它将给出一个示例，说明如何获取示例文档的主题权重： doc_topic = model.doc_topic_ for i in range(10): print doc_topic[i] 是否有类似的功能，将适用于样本以外的文件？

浏览 3提问于2015-09-08得票数 1

回答已采纳

1回答

更快的LDA实现

、、

我正在实现LDA，避免使用开箱即用的库.我试过用python / numpy。有100万条记录，词汇量约为2000，只需7分钟就能运行 of sequential。使用具有8个进程的分布式LDA版本，可将其速度提高到~5分钟分布式LDA:：每个进程将对总矩阵的子集执行一个顺序的GibbsSampling，一旦完成，相应的输出矩阵将被加起来。有什么办法能让它更快吗？将另一种语言的实现全部替换在一起？增加更多的记录~线性增加所需的时间。在我的用例中，我需要运行超过2500万个文档的LDA，这可能意味着1次运行大约144分钟！然后至少运行100次LDA，以确保模型几乎收敛！代码：参考资料：

浏览 2提问于2017-04-01得票数 0

2回答

在Gensim中使用潜在的Dirichlet分配

、、

我正在做一个项目，我想使用潜在的Dirichlet分配，以便从大量的文章中提取主题。我的代码是： import gensim import csv import json import glob from gensim import corpora, models from nltk.corpus import stopwords from nltk.tokenize import RegexpTokenizer from time import gmtime, strftime tokenizer = RegexpTokenizer(r'\w+') cachedStopW

浏览 0提问于2014-11-18得票数 1

1回答

用于AT&T数据集人脸识别的QDA与LDA

、、、

我获得了两个非常不同的准确性AT&T脸数据库时，拟合模型与lda和qda。在使用QDA I之前，首先搜索理想的正则化参数，AFAIK是对QDA进行微调的唯一导入参数。 X_load,y_load = datasets.fetch_olivetti_faces(data_home="R:/DATASET/AT&T", return_X_y=True) 我把它分成一个平衡的训练和测试序列(8张用于训练的图像，2张用于每人测试的图像)。 lda = LinearDiscriminantAnalysis(solver='svd') lda.fit(X_t

浏览 2提问于2018-08-08得票数 0

回答已采纳

1回答

运行Gensim LDA时出现问题

、、、

我正在尝试运行分布式LDA示例，如下所述：我按照这里的教程创建了一组文档：通过“将语料库扩大到100万个文档，重复文档”，正如它所建议的那样。我使用的是python 3.3和numpy 1.9.2，我一直收到以下错误： Exception in thread oneway-call: Traceback (most recent call last): File "/usr/lib64/python3.3/threading.py", line 901, in _bootstrap_inner self.run() File "/usr/lib

浏览 3提问于2016-03-10得票数 4

1回答

OpenCV3，Python3如何训练FisherFaceRecognizer数据集？

、、

我使用openCV 3和Python3来训练人脸识别。我可以训练LBPHFace和EigenFace而没有错误，但是训练FisherFace时它显示错误。这是我的代码。 import os import cv2 import numpy as np from PIL import Image LBPHFace=cv2.face.LBPHFaceRecognizer_create() EigenFace=cv2.face.EigenFaceRecognizer_create() FisherFace=cv2.face.FisherFaceRecognizer_create() path=&#

浏览 2提问于2017-10-27得票数 0

1回答

“numpy.int64”对象在使用潜在的dirichlet分配时不可迭代

、、、

我正在尝试将隐狄利克雷分配算法应用于从twitter数据检索到的.csv文件。目前我遇到了这个错误： Traceback (most recent call last): File "...Python\Python39\lib\tkinter\__init__.py", line 1884, in __call__ return self.func(*args) File "...\src\project.py", line 262, in lda for i in top_topic_words: TypeError: '

浏览 36提问于2021-02-25得票数 0

回答已采纳

1回答

基于多维数据绘制python类之间的分界线？

、、、、

我试图在的基础上，在sklearn Python中使用LDA绘制sklearn虹膜数据集的边界线。对于二维数据，我们可以很容易地使用LDA.coef_和LDA.intercept_绘制线条。但是对于被简化为两个组件的多维数据，LDA.coef_和LDA.intercept有很多维，我不知道如何用它们来绘制二维降维图中的边界线。我试过只使用LDA.coef_和LDA.intercept的前两个元素来绘制图，但没有成功。 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets from s

浏览 0提问于2019-09-03得票数 3

1回答

LDA在Python中，我得到的是字符而不是主题

、、、

我对在Python中执行LDA有点困惑。我有一个文档文件，我想运行LDA并获取主题。 import docx import nltk import gensim from gensim.models import hdpmodel, ldamodel from gensim import corpora def getText(filename): doc = docx.Document(filename) fullText = [] for para in doc.paragraphs: fullText.append(para.text) r

浏览 39提问于2018-07-14得票数 1

回答已采纳

1回答

gensim LdaMulticore不是多处理吗？

、、、

当我在一台有12个核的机器上运行gensim的LdaMulticore模型时，使用： lda = LdaMulticore(corpus, num_topics=64, workers=10) 我收到一条日志消息说 using serial LDA version on this node 几行之后，我看到另一条信息，上面写着 training LDA model using 10 processes 当我运行top时，我看到已经生成了11个python进程，但是有9个进程处于休眠状态，即只有一个工作人员处于活动状态。这台机器有24个核心，不被任何手段压倒。为什么LdaMulticore不

浏览 1提问于2015-11-26得票数 9

回答已采纳

3回答

从gensim LDA模型中提取主题分布

、、

我使用python中的gensim包为一些文本文件创建了一个LDA模型。我想获得学习模型的主题分布。在gensim ldamodel类中是否存在从模型中获取主题分布的方法或解决方案？例如，我使用一致性模型来寻找一个模型，该模型的值与1到5的主题数有关。得到最佳模型后，我使用get_document_topics方法(感谢)来获取用于创建该模型的文档中的主题分布。 id2word = corpora.Dictionary(doc_terms) bow = id2word.doc2bow(doc_terms) max_coherence = -1 best_lda_model = None

浏览 1提问于2018-08-29得票数 2

回答已采纳

1回答

用训练的Spark模型提供实时预测

、、

我们目前正在测试一个基于Spark在Python：中实现LDA的预测引擎(我们使用的是pyspark.ml包，而不是pyspark.mllib) 我们成功地在星火集群(使用)上训练了一个模型。现在，我们正在尝试使用该模型作为API (例如，烧瓶应用程序)来提供实时预测。实现这一目标的最佳途径是什么？我们的主要痛苦之处在于，我们似乎需要恢复整个星火环境，才能加载经过训练的模型并运行转换。到目前为止，我们已经尝试了在本地模式下运行每个接收到的请求，但是这个方法给了我们：性能不佳(是时候拆分SparkSession，加载模型，运行转换.) 可伸缩性差(无法处理并发请求) 整个

浏览 1提问于2017-09-17得票数 6