腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
短文本分类
好的,请提供您需要我进行短文本分类的问答内容,我会尽力为您提供最完善和全面的答案是。
相关搜索:
html标签短文
iis短文件
短文本归类
python 短文本
linux截短文件
html短文本显示
iis短文件漏洞
linux短文件名
短文本相似度
短文本相似度算法
短文本相似度计算
如何使用Sklearn忽略短文档?
使用Python缩短文件路径
改进短文本聚类性能
统一文本和图像分类(Python)
dedecms织梦最新短文学模板
php 简短文件上传代码
iis短文件名漏洞检测
为用户添加短文本/徽章/图标
AsyncDisplayKit:不适合短文本的大小
相关搜索:
html标签短文
iis短文件
短文本归类
python 短文本
linux截短文件
html短文本显示
iis短文件漏洞
linux短文件名
短文本相似度
短文本相似度算法
短文本相似度计算
如何使用Sklearn忽略短文档?
使用Python缩短文件路径
改进短文本聚类性能
统一文本和图像分类(Python)
dedecms织梦最新短文学模板
php 简短文件上传代码
iis短文件名漏洞检测
为用户添加短文本/徽章/图标
AsyncDisplayKit:不适合短文本的大小
页面内容是否对你有帮助?
有帮助
没帮助
相关·
内容
文章
问答
(9999+)
视频
沙龙
2
回答
使用scikit-learn的自定义功能
、
、
我正在做一个对
短文
本进行
分类
的项目。我有一个要求是随着向量化的
短文
本,我想添加额外的功能,如文本的长度,网址的数量等作为每个输入的功能。谢谢,罗米特。
浏览 0
提问于2014-03-24
得票数 4
1
回答
短文
分类
、
、
我即将开始一个项目,我的最终目标是把
短文
分成几门课:“可能对参观X感兴趣”:“不感兴趣或中立”。地点用一组关键词来描述(例如,膳食或类似“中国菜”的几种英里)。因此,理想情况下,我需要一些方法来建模用户的愿望,基于简短的文本分析-然后
分类
根据愿望评分或愿望概率-在这一领域有任何最先进的状态吗?谢谢
浏览 3
提问于2012-04-23
得票数 2
2
回答
推文
分类
、
、
我正在尝试机器学习,所以我想尝试对tweet进行文本
分类
。我收集了一个小的tweet样本,但为了执行任何有监督的学习,我需要手动标记我收集的一些tweet。当我扩展我的数据时,这是一项艰巨的任务。有没有办法在不让我手动标记大量tweet的情况下执行
分类
?或者,无监督学习对这项任务更好吗?
浏览 4
提问于2014-05-23
得票数 0
1
回答
如何有效地对
短文
本进行
分类
,而不是表现为长文本
当我做文本
分类
时,如果文本很长,那么使用朴素贝叶斯
分类
可以获得非常令人满意的性能。然而,当上下文涉及到
短文
本时,如Twitter消息或Stackoverflow中的问题内容,在几乎所有指标上都会获得非常糟糕的结果,如精确度、召回率、ROC...有没有一些实用的建议可以帮助我对这些
短文
本内容进行
分类
? 我会非常感谢你的。
浏览 0
提问于2012-04-23
得票数 0
1
回答
IBM NL
分类
器和NLU自定义模型
分类
之间的区别是什么?
、
、
IBM NL
分类
器和NLU自定义模型
分类
之间的区别是什么? NL
分类
器在文本(可能是
短文
本)上进行训练,当检查NLU自定义模型时,它也可以在自定义数据上进行训练以进行
分类
。 有人知道有什么不同吗?
浏览 9
提问于2019-10-14
得票数 0
3
回答
具有大量类别的
分类
、
假设我有一个包含1000万张图像的训练数据集,其中包含100,000个不同人的图像。我想创建一个ML模型,它可以识别给定图像中的哪个人。考虑到大量的人(类),最好的方法是什么?
浏览 1
提问于2019-12-12
得票数 3
1
回答
密集文本表示
、
目前,我正在探索使用LDA (潜在Dirichlet分配)的想法,但是在处理
短文
本(每个文档2-7个单词)方面存在问题。 手头的任务是简短的文本
分类
。我的数据的类数从10个到20个不等。
浏览 0
提问于2015-12-21
得票数 1
1
回答
是否也能与其他语言一起使用LibShortText?
、
LibShortText是一个用于
短文
本
分类
和分析的开源工具。谁知道答案呢?提前谢谢你。
浏览 0
提问于2016-08-30
得票数 0
1
回答
我是否应该删除很少出现的特性来构建模型?
、
、
、
我有3000篇
短文
,我从它们中提取特征(单词和短语),并建立一个词汇表。我最后得到了6000个功能,其中大多数都是一次或两次。1 0 True因此,如果单词“一”发生,一旦我得到作为一个专栏,它是假的,所有其他2999文
本
。列的数量给我带来了一些问题,因为构建一个
分类
需要花费大量的时间。
浏览 0
提问于2018-03-16
得票数 0
回答已采纳
1
回答
如何使用二进制关联进行多标签文本
分类
?
、
、
我正在尝试使用二进制关联来进行多标签文本
分类
。以下是我掌握的数据:由于源的不同,我的两个集合之间存在着大小的差异。 所以,我想用二进制关联来找到测试集中文本的标签。为了做到这一点,我创建了一
本
字典,其中包含了整个训练集中所有不同的单词,并删除了停止词,只出现一次的单词,以及出现在超过10%的文本中的单词。我的字典里有14714个不同的单词。我试
浏览 0
提问于2016-12-12
得票数 0
回答已采纳
1
回答
如何生成
分类
问题的样本数据集
、
、
我有一个“
短文
本”
分类
问题,输入变量要么是非结构化文本(名称、定义、描述等),要么是
分类
。这些字段没有太多的语义,因为它们是产品名称、区域名称、销售订单类型等。我可以使用regex或lucene规则对某些数据集进行
分类
,并手动验证它们,并确保每个类都有相同数量的样本。但我愿意接受其他建议。
浏览 0
提问于2016-07-16
得票数 2
回答已采纳
1
回答
朴素贝叶斯文档
分类
器的长度归一化
、
、
、
我试图实现一个朴素的Bayes
分类
器来对本质上是特征集(而不是袋子)的文档进行
分类
,也就是说,每个特性都包含一组独特的特性,每个特征最多只能在文档中出现一次。也就是说,对
短文
档进行
分类
,由于文档具有较少的特征,因此产生了更高的后验概率;而对于长文档,则相反。. * P(featureK|class)例如,假设功能"foo“、"bar”和"baz“都出现在积极的培训观察中。然后,具有单一特征&qu
浏览 1
提问于2011-09-09
得票数 5
回答已采纳
1
回答
Apache Nutch仅将文章页面索引到Solr
、
、
、
、
首先,那些
分类
页面或主页不包含任何特定故事的细节,但提供多个页面的链接和简
短文
本。第二,有包含完整故事详细信息的页面,即文章。 现在我的问题是,我如何识别这是真正的文章页面,这个页面是一个
分类
页面。
浏览 4
提问于2020-08-25
得票数 0
1
回答
Jenkins Maven 3构建没有选择最新版本匹配的版本范围。
、
、
我们有构建在jar文件中的项目A和包含对项目A的依赖的项目B,当Jenkins构建项目B时,它并不总是选择项目A的最新版本,即使它在版本范围内。如何解决这个问题,以便项目B总是在范围内获得最新的项目A构建?在Jenkins中,项目A是使用以下Maven3行构建的: clean pmd:pmd deploy -P buildServer -DversionMajor=1 -Dver
浏览 3
提问于2016-04-26
得票数 0
1
回答
如何用TF-国防军训练xgboost
、
、
我试着训练这个模型来
分类
短文
。xgb.XGBClassifier()但我发现了一个错误: ValueError:数据的DataFrame.dtypes必须是int、float、bool或
分类
法提供
分类
类型时,必须将DMatrix参数enable_categorical设置为True.vector。
浏览 3
提问于2021-03-10
得票数 0
3
回答
主题发现/发现的最佳模型
、
、
、
、
在简短的非结构化文档中发现主题的最佳模型是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
LibSVM对LibShortText
、
、
、
、
与使用LibSVM的线性
分类
器与使用LibShortText或LibLinear有什么区别,如果有差异的话?使用SVMlight也是如此;它们的实现是否不同? 谢谢。
浏览 4
提问于2014-03-02
得票数 0
回答已采纳
2
回答
如何提高小文本的
分类
性能
、
、
、
我使用了词袋模型并使用了NaiveBayes
分类
。现在我有很多错误
分类
的案例,都是下面提到的类型:Sentiment Classification : 1.] Negative 2.]NegativeDocument classification : 1.] Movie 2.]Movie 这只是一个这样的例子,我面
浏览 5
提问于2015-12-29
得票数 2
2
回答
如何搜索相似的单词?
、
我正在尝试自动对
短文
进行
分类
,我正在尝试找出如何匹配相似的单词-例如,架子架或绘画和重新绘制 我使用的是Porter词干提取算法,但它只对某些情况有帮助,而且只对词尾有效(上面的两个例子都不适用)。
浏览 0
提问于2010-11-01
得票数 14
回答已采纳
2
回答
用文本和数字特征训练
分类
器--什么是最先进的?
、
、
我正在尝试构建一个二进制
分类
器,其中的特征大多是数字的(大约20个),还有两个非结构化的
短文
本字段。什么是目前被认为是最先进的结合这些类型的功能?我尝试单独使用文本数据构建一个独立的
分类
器(logistic回归,TF下手),然后在使用其余的数值特征(随机森林,注意在数据的不同折叠上训练每个
分类
器以防止信号泄漏)时,将该
分类
器的输出分数作为额外的分数一个变体是简单地训练两个独立的
分类
器,一个使用文本,另一个使用记分特征,然后堆叠这两个
分类
器。
浏览 0
提问于2020-04-22
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
工作分类记事用什么软件?分类记事本哪个好用
本公众号全部文章分类阅读
谷歌为离线设备开发AI系统SGNN,短文本分类准确率达到86.7%
零样本学习在视觉分类中的挑战
医疗健康领域的短文本理解
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券