腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
机器
学习
中
的
数据
标注
、
、
、
、
我将开发一个
机器
学习
模型。我有大量
的
数据
集(文本)。我需要整体更好
的
准确性,F1分数等。我正在使用
数据
注释工具(Dataturk)。将
数据
标记为每个实体
的
单个标签还是每个实体
的
多个标签更好(例如,已经有5次GUI,因此我们必须标记1次或5次,以获得更好
的
整体分数)。我们将非常感谢您
的
帮助。
浏览 16
提问于2020-05-12
得票数 0
1
回答
Watson knowledge studio:如何教我
的
模型获取食谱名称?
、
我一直在使用烹饪食谱来保持
数据
的
简单和易于注释。我
的
目标是能够以非结构化文本
的
形式提交食谱,并获得食谱名称、配料、烹饪设备、预算、饮食等结构化响应。欢迎任何建议:)
浏览 0
提问于2016-12-17
得票数 0
1
回答
机器
学习
中
数据
集
的
标注
、
、
我有一个关于
机器
学习
的
基本概念
的
问题。我观察到
的
例子是简要概述了.For训练系统,给出了特征向量作为输入。在有监督
学习
的
情况下,
数据
集被标记。我对贴标签感到困惑。例如,如果我必须区分两种类型
的
图片,我将提供一个特征向量,并在输出端测试,我将提供1类型A和2类型B,但如果我想从图像
数据
集中提取感兴趣
的
区域。我将如何标记我
的
数据
来提取ROI使用支持向量机。我希望我能表
浏览 1
提问于2016-02-14
得票数 2
1
回答
为什么还没有最终用户应用程序呢?
机器
学习
从深层神经网络开始被大肆宣扬。免责声明:我不是一个
数据
科学家。
浏览 0
提问于2016-02-18
得票数 0
回答已采纳
3
回答
基于
机器
学习
的
边缘检测
、
、
、
、
我读过下面的关于使用
机器
学习
的
边缘检测
的
。他们 是否有人知道或知道如何使用Opencv实现/
浏览 5
提问于2017-04-08
得票数 6
1
回答
为
机器
学习
准备
数据
集
的
正确方法是什么?
、
、
、
在
机器
学习
方面,我是个菜鸟,我试图使用ML对一些
数据
进行分类。现在,我已经对有监督和无监督
的
学习
算法做了一些基本
的
阅读,如决策树、聚类、神经网络..etc等。我很难理解
的
是为ML问题准备
数据
集
的
正确
的
总体过程。我目前
的
理解是,为了评估准确性,算法应该输入预先标记
的
结果(来自
数据
集<
浏览 2
提问于2013-10-14
得票数 7
1
回答
基于深度
机器
学习
的
数据
集
标注
、
、
、
、
我试图创建CNN张量流来进行文本识别,我已经遵循了如何使用MNIST
数据
集构建它
的
教程,我试图做
的
是将我自己
的
数据
集添加到模型
中
并对其进行训练,但是CNN是作为监督构建
的
,我
的
数据
集没有标签。我应该如何给
数据
集一个标签,我试图使用不同
的
标签方法,如标签盒和亚马逊机械土耳其,但没有成功。有没有办法给
数据
集贴上标签,或者把CNN转换成一个无人监督
的
网站? 示例
浏览 0
提问于2018-02-24
得票数 0
1
回答
机器
学习
手动
标注
质量
、
有一组标签,当我评估性能时,我看到一般所有的标签可以分为两组,性能好
的
标签和性能差
的
标签,它们之间
的
差距很大。 我正在寻找一种方法,如何评估手动标签
的
质量。我知道这不是微不足道
的
,但我肯定可以做一些调查。例如,在好
的
标签
中
,我看到有一组具有高权重
的
属性来表征这些标签,而对于性能较差
的
标签,我看不到任何好
的
特征。为了看清楚好标签和坏标签之间
的
区别,还可以做些什么?
浏览 1
提问于2014-03-25
得票数 0
1
回答
基于
机器
学习
的
文本
标注
、
、
、
我想根据一组预定义
的
类(例如,它在clojure
中
的
一个映射)来标记一组银行事务。我尝试了一种朴素
的
bayes方法,但有时它完全给了我错误
的
标签。根据我
的
研究,我应该使用一种监督
的
ML算法,类似于线性支持向量机,用于多类分类。问题是我对ML一无所知。第二个问题是,大多数clojure库已经过时了。{:label "IMPOSTO DE SELO", :value -17 :class :banking} 因此,大多数类似的交易都有90%相似的文本(参
浏览 1
提问于2017-07-13
得票数 2
回答已采纳
2
回答
标签样本与人群比例
的
差异
、
、
、
我正在做一个项目,从社会媒体
的
合法用户那里预测
机器
人。我收集到
的
数据
中
,95%
的
合法用户拥有大约5%
的
机器
人。问题是,当我给我
的
数据
贴上标签时,我更多
的
是给
机器
人贴上标签,而不是给合法
的
用户贴上标签,因为这样更容易找到
机器
人(它们拥有相同
的
信息、生物、照片、生物URL域等等)。虽然给真实的人贴上标签是很难
的
,但
浏览 0
提问于2022-11-25
得票数 2
1
回答
从文本中提取产品实体
、
我试图使用一个名为
的
实体识别器从给定
的
文本中提取产品名称。输入文字:“Google使google适合”是否已经有任何工具可用于此?(我测试了与提取产品名称无关
的
炼金术API ) 如果没有这样
的
工具,我如何建立自己
的
培训模型来实现这一点?
浏览 1
提问于2014-11-16
得票数 3
3
回答
基于历史
的
评分系统生成算法
、
、
我是
数据
科学
的
初学者。我有一组
数据
驱动程序,这些驱动程序具有以下属性-速度GPS坐标 我需要建立一个司机评级系统,在1-100
的
速度参数上对司机进行评分。
数据
集拥有来自许多驱动程序
的
数据
以及它们过去
的
数据
。在这种情况下,我能使用
的
最佳算法是哪一种?
浏览 0
提问于2016-03-14
得票数 1
1
回答
腾讯云词法分析接口,词性
标注
不精确?
、
为什么同一句话
中
同一个词
数据
模拟中词性
标注
可以
标注
nz、ntc,而在线调用只能
标注
为n。使用高精度模式。
浏览 262
提问于2022-03-07
3
回答
时间序列
中
的
异常检测:如何
标注
数据
、
、
、
如何对时间序列进行
标注
,以便在
机器
学习
模型上进行训练,将
数据
点分类为异常点? 如果我有时间序列,而异常发生在t时,我应该将这个点和其他点标记为0,还是有其他方法来标记这个时间序列?
浏览 0
提问于2019-08-12
得票数 0
2
回答
FrameNet
中
语义角色
的
自动
标注
、
、
我想使用一些
机器
学习
方法在FrameNet词典中进行自动语义角色
标注
。你能给我推荐一些最适合这个项目的java包吗?
浏览 4
提问于2011-12-18
得票数 5
9
回答
AI领域无监督
学习
有哪些难点?
AI 领域面临者一个巨大
的
问题,如何做到无监督
学习
?因为有监督
学习
从
数据
清洗、特征工程、算法设计、模型训练与优化,到之后
的
实施、部署阶段,人力和时间成本很高,给 AI
的
普及带来了不小麻烦。所以想问下目前AI领域无监督
学习
有哪些难点?
浏览 2221
提问于2018-05-31
2
回答
使用
机器
学习
来解析excel文件并提取不涉及命名表
的
表
数据
?如果是的话,我该如何开始?
、
、
我读过几篇关于
机器
学习
的
文章。假设
机器
有一个只有一个工作表
的
excel文件(假设是.xlsx)。在工作表
中
,将有一个表(定义为有一个标题行和至少两个
数据
行),并将由读取该文件
的
常识性人商定为一个表。而不是MS定义
的
命名表或对象)
浏览 6
提问于2017-12-01
得票数 3
1
回答
改进非英语文本
的
NER标签结果
、
、
我正在研究一些中世纪拉丁文,并使用各种方法
的
NER,如CLTK (拉丁模型),Spacy (多语种,意大利语,西班牙语模型)和StanfordNER (西班牙语模式)。当我使用非拉丁模式时,我使用了原文,因为翻译
的
文本没有任何意义。 幸运
的
是,Spacy多语言模型成功地提取了示例文档
中
的
所有人员和位置,但我没有将它们视为实体。此外,标签是不正确
的
。问题是我没有任何训练
数据
,我认为唯一可能有用
的
语料库是Proiel,它将专有名词标记为NE。这样
的
浏览 0
提问于2018-08-08
得票数 6
1
回答
在sklearn管道
中
包括未标记
的
数据
、
、
我正在建立一个
机器
学习
管道来分类一些
数据
。我有很多未
标注
的
数据
(例如,目标变量未知),我想利用这些
数据
。我想这样做
的
方法之一是使用未贴标签
的
数据
来安装我
的
管道
中
的
变压器。例如,对于调用StandardScaler时正在缩放
的
变量,我希望它适合给定
的
培训
数据
加上未标记
的
数据
,然
浏览 5
提问于2022-04-28
得票数 0
回答已采纳
1
回答
将实际
数据
与仿真
数据
相结合是否提高了
机器
学习
的
性能?
、
我试图训练一个
机器
学习
模型来帮助我分类一些真实
的
数据
。由于实际
数据
的
采集和
标注
成本很高,因此采用仿真方法生成训练
数据
。然而,经过训练
的
模型在真实
数据
上
的
表现并不好,我怀疑模拟并不是真实
数据
的
100%精确表示。因此,我想知道,如果我用仿真和真实
数据
(例如20%
的
真实
数据
)来训练模型,那么性能会得到改善吗?如果你能
浏览 0
提问于2022-10-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据标注还能更快!谷歌发布图像标注机器学习辅助工具
目标检测中的数据标注
机器学习中数据相关介绍
聊聊机器学习中的非平衡数据集
在机器学习中处理缺失数据的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券