腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1823)
视频
沙龙
2
回答
NLTK
/
NLP
设计了一个多到
多
/
多
标签
的
主题
分类
器
、
、
、
、
我有一个由5000多个
主题
索引的XML文档组成的人工标记语料库。它们的大小从几百千字节到几百兆字节不等。是抄本的短文。他们都被编入了与段落级别一样深的索引。我很幸运有这样一个语料库可用,我正在努力教自己一些
NLP
概念。无可否认,我才刚刚开始。到目前为止,只阅读免费获得的
NLTK
书,,和浏览jacobs(?)
NLTK
食谱。我喜欢尝试一些想法。有人向我建议,也许,我可以拿双标,用朴素的贝叶斯
分类
来标记新的文档。我觉得这是错误的做法。朴素的Bayes精通一种真实/错误的关系,但是要在我的层次标记集上使
浏览 1
提问于2011-10-12
得票数 7
回答已采纳
1
回答
多
标签
和
多
标签
-
多
类
分类
的区别是什么?
、
、
我正试图将新闻文章
分类
为它们所需的类别。然而,我对上述术语(
多
标签
和
多
标签
-
多
类)感到困惑。我的数据集由2个csv文件组成。第一个文件包含新闻文章的内容。同一
对
应行号中的第二个文件由与其关联的
标签
组成。下面是第二个文件(即
标签
文件)中的示例条目:因此,对于第1行,第一个csv文件包含了标题为体育和足球的新闻文章。同样,对于第2行,第一csv中的文章有运动和媒体的
标签
。我的问题是,这是数据集
多
<
浏览 0
提问于2019-06-11
得票数 2
回答已采纳
2
回答
用
NLTK
、scikit learn和OneVsRestClassifier启动
多
标签
分类
、
、
、
、
免责声明:我是非常新的人工智能,Python,
NLTK
和科学工具包-学习。 我试图训练一个
分类
器
来将一组文档
分类
为一组
标签
。,其中
分类
器
只尝试将文档
分类
为
标签
。准确性很好,但我希望
分类
器
为文档分配0、1或更多
标签
。我怎么能这么做?遗憾的是,我不能仅仅初始化
分类
器
,告诉它是一个
多
标签
分类
浏览 5
提问于2016-03-24
得票数 2
回答已采纳
1
回答
将
多
标号问题转化为
多
类问题
、
用单个
分类
器
将
多
标签
问题建模为
多
类问题的缺点是什么?1)因此,每个
标签
组合的每个元素。2) 有一个N长度的输出向量(向量的每个元素都是一个
标签
),但是这个问题将被视为一个
分类
浏览 0
提问于2019-07-22
得票数 3
1
回答
NLTK
-
多
标记
分类
、
、
、
我使用
NLTK
对文档进行
分类
--每个文档有一个
标签
,其中有10种类型的文档。对于文本提取,我清洗文本(标点符号删除,html标记删除,低胁迫),删除
nltk
.corpus.stopwords,以及我自己的停止词集合。对于我的文档特性,我将查看所有50k文档,并按频率( frequency_words )收集前2k单词,然后
对
每个文档标识文档中也在全局frequency_words中的单词。我遇到的问题是: 这个由
NLTK
提供的
分类
器
是否适用于多个<
浏览 1
提问于2014-05-09
得票数 7
回答已采纳
1
回答
门对
NLP
有多好?
、
、
、
我正在尝试构建一个
NLP
应用程序,它本质上必须做命名实体识别(NER)。我偶然发现了。据我所知,这是一个构建
NLP
应用程序的框架。我
对
安妮进行了测试,IE系统中有了not,但是对于我的领域,NER的结果并不令人满意。事实上,任何NER,如斯坦福大学CoreNLP或
NLTK
,都没有给我必要的结果。因此,我决定
对
现有的系统进行调整,以获得预期的结果。添加新组件的门有
多
灵活?例如,有一天,如果我想使用
NLTK
的POS
标签
在大门内? 如果我想使用自定义机器
浏览 3
提问于2017-02-23
得票数 7
1
回答
多
类逻辑回归在SciKit学习中的应用
、
、
、
对于
多
类情况,我
对
Scikit的Logistic回归的正确调用有问题。我使用的是lbgfs解算
器
,并且将multi_class参数设置为multinomial。我不清楚如何在拟合模型时传递真实的类
标签
。我曾假设它与随机森林
分类
器
多
类类似/相同,其中您可以传递n_samples、m_classes数据帧。因此,这是我的问题:如何将完整的类
标签
集传递给fit函数? 我在互联网上找不到可以建模的示例代码,在StackOverflow上也找不到这个问
浏览 0
提问于2016-04-10
得票数 4
回答已采纳
2
回答
用低质量训练集训练
多
标记
分类
器
、
、
、
、
因此,我正在创建一个
主题
分类
器
,其中一个文档可能被标记为几个不同的
主题
,比如- A,B,实际上该文档属于A、B和C。在培训阶段,我希望
分类
器
学习文档属于A和B,但我不确定C类,所以我不希望它知道文档不属于C类。我考虑在输出
标签
中添加权重(低权重意味着文档不可能属于方面,高权重意味着文档确实属于方面,而中等权重意味着我不确定(因此这种情况下的惩罚将更低)。
浏览 0
提问于2016-07-31
得票数 1
回答已采纳
2
回答
文档的监督
标签
建议
、
、
、
我有成千上万的文档和相关的
标签
信息。但是,我也有很多没有标记的文档。我知道
NLTK
、gensim、word2vec和其他库
对
解决这个问题会很有用。 我将使用Python
对
该项目进行
浏览 0
提问于2017-06-26
得票数 0
3
回答
用于监督
主题
分类
的最佳Python
NLP
库
、
、
、
我有一个
标签
数据集,我已经摄取到一个数据。copyright', dtype='object') 其中,文本列包含文章的正文(文本),
主题
列包含关联
主题
的列表我想从这个数据集中训练一个模型来预测文章
主题
。我正考虑用变压
器
(https://huggingface.co
浏览 0
提问于2021-04-20
得票数 0
3
回答
机器学习文本
分类
,其中一个文本属于1到N类
、
、
、
因此,我试图(只是为了好玩)根据电影的描述
对
电影进行
分类
,其想法是“标记”电影,因此给定的电影可能同时是“动作”和“幽默”。通常,当使用文本
分类
器
时,您得到的是给定文本所属的类,但在我的示例中,我希望将文本分配给1到N标记。,告诉我每个
标签
是否属于单一文本,因此,例如,如果我想知道一篇文章是否被归类为“幽默”,我将得到以下的培训集:|在那之后,我总共用了4个
分类
器
,它们是 行动/
浏览 5
提问于2016-04-13
得票数 0
回答已采纳
1
回答
NLP
关于有序等级
多
类
分类
的术语和建议
、
、
我在医疗保健部门工作,并试图看看是否可以使用
NLP
来完成复杂句子的
分类
任务。为了解释,我有不同的
标签
,每个
标签
有多个层次。然而,我不确定正确的术语。我有
标签
X,X总是以4‘级之一的形式存在:“少数”,或1“无处不在”,或3'X和
浏览 0
提问于2022-10-24
得票数 1
3
回答
多
标签
文档
分类
、
、
、
我有一个数据库,我在其中存储基于以下三个字段的数据: id,文本,{
标签
}。请注意,每个文本都已分配给多个
标签
\标记\类。我想构建一个模型(weka \ rapidminer \ mahout),它将能够推荐\
分类
一堆
标签
\
标签
\类到给定的文本。 我听说过SVM和朴素贝叶斯
分类
器
,但不确定它们是否支持
多
标签
分类
。
浏览 3
提问于2013-05-21
得票数 7
1
回答
一个
多
标签
文本
分类
问题
、
、
、
我想解决一个
多
标签
的文本
分类
问题,但是我真的不知道如何正确地表述它,这样我就可以查找它。我的问题是:我想把句子分为三个
标签
(例如)目标、方法和结果。其结果将是: object
浏览 0
提问于2022-03-11
得票数 2
回答已采纳
1
回答
在
NLTK
中导入SVM轻型文件格式
、
、
我试图使用
NLTK
来训练一个用于
多
类文本
分类
的朴素贝叶斯
分类
器
。但我无法接触原始文本。我得到的是一个支持向量机轻型格式的文件(每一行都有一个带有特性:value
对
的实例)。我只需导入这个文件,并使用这个数据集训练和测试朴素贝叶斯
分类
器
。我想知道是否有办法将这个文件导入
NLTK
并直接用于训练
分类
器
。
浏览 0
提问于2014-03-24
得票数 2
回答已采纳
1
回答
如何计算多任务模型中的样本权重?
、
、
具体来说,我有一个输出400个类
多
类
分类
,以及一个5类
多
标签
分类
的模型。所有的课程都是不成比例的,不平衡的。在没有样本加权的情况下,
多
类
分类
器
的
分类
准确率达到90%以上,并且
对
多
标签
分类
中的某些类有较好的AUC。目标是提高
多
标签
分类
任务中的一个类的性能。这门课相当不平衡。
浏览 0
提问于2023-04-25
得票数 0
2
回答
机器学习-单级、二元类和
多
类
分类
的区别在哪里?
、
、
、
单类、二元类和
多
类
分类
的区别是什么?我就不能用上面提到的所有方法来达到我的目标吗?例如,我可以将C1、C2、C3和C4描述为四种不同的二进制
分类
训练集,并使用经过训练的模型来标记未知的数据集.对于多项式
分类
,我只需在一个训练集中定义一个训练集,其中包含C1、C2、C3和C4的所有良好样本数据,然后使用一个结果模型进行
分类
。 但是这两种方法有什么区别呢?(除此之外
浏览 0
提问于2014-10-20
得票数 6
1
回答
keras
分类
和二进制交叉熵
、
、
、
在我的例子中,我希望用LSTM模型预测在线评论的多个
标签
,比如(正、负和中性)。这些
标签
被转换成一个热点向量,在keras中使用to_categorical方法,这也在keras中有记录: array([[1., 0., 0.], [0., 0., 1.],
浏览 1
提问于2018-05-24
得票数 3
回答已采纳
1
回答
一种支持非线性核和
多
标签
的支持单
对
少的支持向量机实现
、
、
、
、
我正在寻找一个支持支持非线性内核和一个vs-rest场景的支持向量机实现,以执行
多
标签
分类
。最好是用Python编写的,或者我可以用wrappers从Python调用。我正在研究sklearn,有两个实现可以使用支持向量机进行
分类
: -支持单点rest场景下的
多
标签
分类
,但它是基于lib线性的,因此只支持线性内核。基于libsvm的 -支持非线性核,但是
多
标签
分类
是在一
对
一的缩减下完成的,它训练K
浏览 4
提问于2017-03-21
得票数 5
回答已采纳
2
回答
支持向量机
多
类文本
分类
、
、
我想
对
新闻数据集和训练数据进行
分类
,并使用IPTC
主题
代码进行
分类
(层次
分类
)。在我的项目中,我应该使用svm。就像这样:我不知道如何使用svmmulticlass 我也听说过一
对
一
浏览 2
提问于2010-07-26
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
NLTK,一个自然语言处理操作的 Python 库!
自然语言处理简明教程
Python 自然语言处理:文本理解与生成的奥秘
基于 TensorFlow 2.0 的长短期记忆网络进行多类文本分类
NLP 技术在微博 feed 流中的应用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券