腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
来自
NLTK
,
Gensim
,
Scikit
Learn
的
API
调用
、
、
、
、
我计划使用
NLTK
、
Gensim
和
Scikit
Learn
来进行一些NLP/文本挖掘。但我将使用这些库来处理我
的
组织数据。问题是,在使用这些库时,它们是进行
API
调用
来处理数据,还是从python shell中取出数据进行处理。这是一个安全问题,所以我想知道是否有人有任何文档可供参考。 感谢大家在这方面的帮助。
浏览 8
提问于2020-01-22
得票数 1
回答已采纳
10
回答
如何检查哪个版本
的
nltk
,
scikit
学习安装?
、
、
、
、
因此,使用shell脚本:echo
nltk
.__version__在linux终端中,试图以这种方式查看:这并没有让人以为它已经安装好了。
浏览 6
提问于2015-02-13
得票数 129
回答已采纳
2
回答
使用Python 3.5.2_2
调用
NLTK
时出现问题?
、
、
、
当我尝试在python 3.5.2_2中导入
nltk
时,我得到以下消息:Traceback (most recent call last): from
nltk
.align import * File "/usr/local/lib/python3.5/site-packages/
nltk
/align
浏览 0
提问于2016-10-10
得票数 0
1
回答
Scikit
-学习GridSearchCV在
gensim
LDA模型上
的
失败
、
、
、
、
这是创建模型
的
代码:NUM_TOPICS = 4NUM_TOPICS,id2word=dictionary,passes=100)topics = ldamodel.print_topics(num_words=4)这是GridSearchCV
的<
浏览 4
提问于2020-03-09
得票数 1
回答已采纳
1
回答
如何用朴素贝叶斯实现TF_IDF特征加权
、
、
、
我正在尝试实现朴素贝叶斯分类器来进行情感分析。我计划使用TF-IDF权重度量。我只是有点卡住了。NB通常使用单词(特征)频率来找到最大似然。那么,如何在朴素贝叶斯中引入TF-IDF权重度量呢?
浏览 2
提问于2011-06-09
得票数 3
1
回答
在
scikit
中使用
nltk
regex示例-学习CountVectorizer
、
、
我试着使用
nltk
书中
的
一个例子来获取CountVectorizer内部
的
regex模式。我看到了一些简单正则表达式
的
例子,但是没有这样
的
例子: (u'', u'', u''), (u'', u'-ridden', u''
浏览 0
提问于2014-08-18
得票数 2
回答已采纳
1
回答
用于word2vec
的
自定义转换器和FeatureUnion
、
、
、
、
我正在使用来组合不同
的
功能,以适应单个模型。其中一个功能包括使用嵌入单词。import numpy as npfrom sklearn.pipeline import FeatureUnionTruncatedSVD(n_components=50, algorithm = "randomized", n_iter = 5)为了包含sklearn中尚未提供
的
转换器in self.word2vec]
浏览 0
提问于2017-11-14
得票数 0
1
回答
nltk
:使用自定义特征集
的
文本分类
、
、
、
、
identifierN: labelN} 我想找出最合适
的
nltk
容器,在其中我可以将这些信息存储在一个地方,并无缝地应用
nltk
分类器。
浏览 2
提问于2013-09-30
得票数 1
1
回答
在
nltk
中使用
scikit
-
learn
分类器,多类情况
、
、
文本文档
的
分类是一个,但在
NLTK
中没有一个干净
的
支持,也有像这样困难
的
方法来做这件事
的
示例。我想用
NLTK
进行预处理,并用sckit-
learn
进行分类,我在
NLTK
中发现了SklearnClassifier,但有一个小问题。在
scikit
-
learn
everything is OK:from sklearn.multi
浏览 2
提问于2012-11-23
得票数 6
回答已采纳
1
回答
无法分辨出这一差别
我发现支持许多不同
的
wrt参数。例如,对于分类,前者不支持feature_interation,后者不显示Score_0和Score_1概率。这些只是几个例子。
浏览 18
提问于2022-08-16
得票数 0
1
回答
用
NLTK
的
SklearnClassifier和ClassifierBasedPOSTagger构建自己
的
分类器词性标签器
、
、
、
、
我正在尝试使用SklearnClassifier和ClassifierBasedPOSTagger构建自己
的
基于分类器
的
词性标记器。我尝试过
的
代码如下所示。from
nltk
.corpus import treebanktrain_data= data[:3500] test_data = data[3500:] from
nltk
.classify
浏览 10
提问于2021-08-11
得票数 0
回答已采纳
1
回答
有办法绕过AWS函数
的
250 MB限制吗?
、
、
、
、
我正在使用AWS中
的
Lambda函数,并尝试使用层来加载依赖项(即状态模型、
scikit
-
learn
、pyLDAvis、熊猫、numpy、
nltk
、matplotlib、load、
gensim
和eli5),但我无法添加它们,因为我收到一个错误,其中指出代码和层
的
最大允许大小为262144000字节(250 MB)。或者,我是否有办法删除包中
的
一些子目录--例如,我只需要状态模型
的
发行版,那么我能删除所有其他内容吗?
浏览 0
提问于2021-07-30
得票数 0
回答已采纳
1
回答
当setup.py中加入细胞化时,Travis颜色消失
、
、
、
/test ; scipy and
scikit
-
learn
requires numpy even to run setup.py so pip install scipy
scikit
-
learn
commands
浏览 0
提问于2019-05-08
得票数 1
回答已采纳
2
回答
NLTK
:使用数字分数而不是标签进行文档分类
、
在一个项目中,我一直在使用Python
NLTK
、文档分类和朴素贝叶斯分类器。正如我从文档中了解到
的
,如果您
的
不同文档被标记为pos或neg作为标签(或超过2个标签),这将非常有效。我正在处理
的
已经分类
的
文档没有标签,但它们有一个分数,一个介于0和5之间
的
浮点数。 我想要做
的
是构建一个分类器,就像文档中
的
电影示例一样,但它将预测一段文本
的
分数,而不是标签。我相信文档中提到了这一点,但从来没有进一步探讨过“数字特征
的
概
浏览 1
提问于2012-10-23
得票数 8
2
回答
NLTK
最大熵分类器原始分数
、
、
、
这是我关于stackoverflow
的
第一个问题,请耐心听我说。我
的
问题是,我几乎没有用于训练分类器的人工注释训练数据。因此,它不是一个很好
的
分类器。因此,我
的
老师建议我查看MaxEnt分类器
的
原始分数,看看是否存在某个分数阈值,超过这
浏览 0
提问于2012-09-12
得票数 2
1
回答
用WordNet比较两个短语?
、
、
、
、
我正在试着比较两个短语
的
语义。在Python中,我使用
nltk
和difflib。首先,我从短语中删除停止词,然后我使用WordNetLemmatizer和PorterStemmer对这些单词进行规范化,然后将其余
的
单词与SequenceMatcher
的
衍射库进行比较。我仍然认为有一个比使用衍射更好
的
方法。有什么建议或建议吗?在短语之间
的
比较中有没有使用Wordnet
的
库?我所做
的
步骤正确吗?
浏览 2
提问于2014-05-07
得票数 0
回答已采纳
1
回答
当joblib有_thread.lock 2作业时,keras.wrappers无法pickle >=对象
、
、
我研究了类似的问题,但没有一个问题真正解决了我
的
错误。
浏览 0
提问于2018-03-28
得票数 0
1
回答
gensim
在
Scikit
学习中
的
simple_preprocess替代方案是什么?
、
、
通过使用
Gensim
执行LDA,我能够使用以下方法进行初始文本预处理和清理:它非常高效,几乎可以在一个命令中进行所有形式
的
文本清理。现在,我正在尝试使用
Scikit
LDA来学习LDA,我想知道是否有类似的方法来使用Sci-kit学习来实现相同
的
预处理,而不是必须加载两个库。
浏览 1
提问于2022-03-27
得票数 0
4
回答
多字袋文本分类器
、
、
我正在训练一个电子邮件分类器从一个数据集与单独
的
列为主题行和电子邮件本身
的
内容。我已经对内容列进行了预处理,使主题和相关元数据被完全删除。在这一点上,我
的
想法是,我应该在两个单独
的
词袋上训练分类器,一个是主题栏,另一个是内容栏。这样做对吗?是否有一种使用
NLTK
或类似库来完成此操作
的
简单方法?
浏览 0
提问于2017-11-22
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券