腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
文本
分类
中
,
如何
对
不属于
“
未知
”类
别的
文本
进行
分类
?
、
我正在解决一个NLP问题,将
文本
分为四
类
。1.体育2.娱乐3.占星术4.
未知
我已经为体育、娱乐、占星术创建了一个训练数据集。但是
如何
为“
未知
”类别创建训练数据集,或者
如何
将
不属于
前三个类
别的
文本
分类
到最后一个类别,即“
未知
类别”?
浏览 10
提问于2018-09-03
得票数 1
3
回答
如何
处理机器学习
分类
问题中的“
未知
”类别?
、
、
、
教程问题以二进制或多
类
分类
的形式出现,其中所有的数据都有适当的标签。
在
实际应用程序
中
,有
不属于
任何类别且不能
分类
的传入数据。我们
如何
处理这些属于“
未知
”类
别的
数据?“
未知
”的宇宙可能远不止“已知”。因此,“
未知
”的数据可能过多,导致阶级不平衡。我们
如何
训练模型来处理“
未知
”数据?还是我们忽视了它?
浏览 0
提问于2018-09-02
得票数 5
回答已采纳
1
回答
将
文本
分类
为预定义的类别
、
、
我试图将
文本
数据
分类
为几个类别。但是在数据集中,可以有
不属于
任何定义类
别的
数据。为了实现该解决方案,我目前正在使用SVM
文本
分类
器。我打算把另一个类别定义为,这是一个正确的方法吗?
浏览 1
提问于2020-01-26
得票数 1
1
回答
在这种情况下,二进制
分类
是正确的选择吗?
、
、
、
、
我对
文本
分类
有点陌生,如果你们能帮忙的话,我有一些问题要问:我正在使用一个基于BERT的二进制
分类
浏览 0
提问于2021-12-08
得票数 1
回答已采纳
1
回答
在
ML
文本
分类
中
,如果
文本
不属于
任何类别,怎么办?
、
、
对于体育、政治、商务、娱乐等新闻类型,我采用逻辑回归的方法
进行
文本
分类
,而
不属于
上述类
别的
文本
也被预测为其中之一。
如何
在机器学习
中
防止这种情况?另外,
如何
将类别外
文本
添加到other_category标签
中
?
浏览 0
提问于2020-05-05
得票数 1
回答已采纳
2
回答
在
多
类
分类
中
是否可能有一个默认的
类
?
、
、
在
一般的
文本
分类
问题中,训练机器学习模型来检测一个
文本
是否属于N个
类
中
的一个,它总是
在
N中产生一个值。即使传递给模型的
文本
远远超出了N
类
中
的任何一个(比如您为电影类型训练了它的类别,但是有人将它的配方传递给了
分类
器),它总是会选择N
中
的一个作为输出,即使传递给它的
文本
不属于
任何一个
类
。是否有方法为“
未知
”有一个
浏览 0
提问于2019-09-20
得票数 2
1
回答
朴素贝叶斯
文本
分类
在
一个类别
中
失败。为什么?
、
、
、
、
我想提高准确性,所以我决定实现37个双向
分类
器(是其中之一),这些
分类
器将对给定的
文本
负责:我将通过依次应用它们来确定
文本
的类别但是我发现第一个
分类
器有问题,它总是
在
"specific_category“
类
中
失败。 我有培训数据- 37
类
,100份文件,每个类
别的
大小相同。然后,我总是失败在“农业”类别,虽然
文本
<
浏览 0
提问于2013-05-17
得票数 3
回答已采纳
2
回答
Scikit-学习默认
类
、
、
、
、
我正在使用scikit learn
对
一些
文本
进行
分类
,我有10个班级,我正在使用svm.SVC(kernel='linear',probability=True,class_weight='balanced')、MultinomialNB()和tree.DecisionTreeClassifier()
进行
分类
。树
分类
器做得很好,三个
分类
器的准确率都在80-90%(这对我的应用程序来说已经足够了)。问题是有一些<e
浏览 3
提问于2016-10-18
得票数 2
1
回答
文本
分类
-处理
不属于
任何类
别的
文本
、
、
我正在开发一个
文本
分类
器,并找到了一些可靠的选择。然而,我正在努力处理的一件事是处理不适合任何预定义类
别的
文本
。这肯定会是我们
在
真实数据中看到的,所以我需要了解
如何
处理它。我认为这是一个问题,因为如果
文本
没有遇到类别,算法仍然要求该输出等于1,并且它仍然会为该
文本
分配一些任意标签,即使它确实不应该这样做。有没有人
对
一些我可以尝试解决的方法有什么建议? 谢谢
浏览 23
提问于2021-05-13
得票数 0
2
回答
文本
分类
:
分类
N
类
与其他
类
、
、
、
、
我有一个要求,当我试图
分类
两种类型的
文本
数据,即,我有两个类别来
分类
我的数据。我可以通过文字向量,降维,然后将数据输入到LinearSVC
进行
分类
,从而得到可接受的结果。我知道tfidf在这方面会有帮助,但是有什么方法可以应用到单词向量
中
,我不想失去它对
未知
的类似数据的预测能力吗? 这方面的后续问题是,除了我培训过的两个
类
之外,还有来自其他
类
的数据。我希望我的模型能够预测数据
不属于
这两个
类
中
浏览 0
提问于2020-06-23
得票数 2
回答已采纳
1
回答
组合多
分类
器建立多模态
分类
器
、
假设我有兴趣
对
由不同内容类型组成的一组实例
进行
分类
,例如:图像给出一个示例,我将其细分为
文本
和图像。第一个支持向量机二进制
分类
器(SVM-text)只对
文本
进行
训练,将
文本
分类
为
类
C的relevant/non-relevant。S
浏览 0
提问于2014-09-16
得票数 3
回答已采纳
1
回答
多任务学习
、
、
有人能用简单直观的方式解释一下多任务学习吗?可能一些现实世界的问题是useful.Mostly,这些天我看到许多人正在使用它来完成自然语言处理任务。
浏览 4
提问于2011-12-31
得票数 5
回答已采纳
1
回答
python
中
给定的特定集群的文档聚
类
、
、
、
我们
如何
将
文本
分类
到python
中
给定数量的集群
中
?我知道可以使用一些机制来指定集群的数量,比如k-均值,但是我需要将给定的集群
分类
到特定的类别。
在
python中有实现这一目标的方法吗?我
在
谷歌上搜索过但找不到合适的匹配。提前谢谢!!
浏览 0
提问于2021-07-19
得票数 0
1
回答
scikit学习
对
无关(域外)数据
进行
分类
、
、
、
我已经使用20个域训练了我的
分类
器,使用MultinomialNB。但问题是,假设我使用20个域中的
文本
进行
查询,即使它对该
文本
进行
了
分类
。查询
不属于
这些域中的任何一个,即使它为任何域提供33%的结果。
如何
显示属于域外查询的0结果?另外,有没有办法
在
查询
中
查看stopwor
浏览 0
提问于2014-09-03
得票数 0
2
回答
利用机器学习
对
大
文本
进行
分类
、
、
、
、
我有一个大型的xls文档,其中每行都包含一个问题id、它的描述以及expl的
分类
:类别1- A- a1描述功能是一个长
文本
。我正在考虑多项logistic回归,但我读到它需要数值数据。我是否必须将文档中使用的所有单词编成词典才能给它一个数值?我也希望每个新条目都有分数来
分类
最近的
类
(对于一个新的描述X,类别2-B-b1给出了8
浏览 4
提问于2018-03-07
得票数 1
回答已采纳
1
回答
自然语言
分类
器返回未训练项目的
分类
、
我
对
NLC是
如何
工作的感到困惑。我的期望是,当它被要求对
文本
进行
分类
时,它应该没有关系或训练数据可供学习,它应该返回没有结果或具有非常低置信度分数的结果。我已经用一组训练数据训练了一个模型,当我试图
对
训练数据之外的
文本
进行
分类
时,我得到了高置信度值(~60%)的结果。这是我的训练数据的一个例子:bar,1,2,3,4当我试图对
文本
进行
分类<
浏览 5
提问于2017-04-12
得票数 0
1
回答
如何
在UML
中
定义
未知
对象或元素?
如果我有一组
未知
的元素,例如person、servers等,那么有什么方法可以
在
UML
中
对
这些元素
进行
分类
吗? 例如,
如何
对
没有名称的服务器
进行
分类
,因为该信息丢失了,并且没有文档或其他信息?UML有可识
别的
占位符名称吗?
浏览 3
提问于2013-12-02
得票数 0
回答已采纳
1
回答
必须使用复杂的还是几个简单的模型?
我不明白模型是
如何
组织起来的。一般来说,我是否需要为我的tree structure的每个叶子建立一个模型来<e
浏览 2
提问于2018-07-05
得票数 0
3
回答
具有大量类
别的
分类
、
我想创建一个ML模型,它可以识别给定图像
中
的哪个人。考虑到大量的人(
类
),最好的方法是什么?
浏览 1
提问于2019-12-12
得票数 3
2
回答
机器学习-单级、二元
类
和多
类
分类
的区别在哪里?
、
、
、
单
类
、二元
类
和多
类
分类
的区别是什么?我就不能用上面提到的所有方法来达到我的目标吗?例如,我可以将C1、C2、C3和C4描述为四种不同的二进制
分类
训练集,并使用经过训练的模型来标记
未知
的数据集.对于多项式
浏览 0
提问于2014-10-20
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用 AWS SageMaker BlazingText 对不均衡文本进行多分类
深度学习在文本分类中的应用
CapsuleNet在文本分类中的应用(一)
CNN与RNN对中文文本进行分类-基于TENSORFLOW实现
基于 TensorFlow 2.0 的长短期记忆网络进行多类文本分类
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券