腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
机器
学习
分类
中
寻找
降低
误报率
的
方法
、
、
、
、
在
经典
的
欺诈预测问题中,有没有办法
降低
误报率
?目前,我正在研究经典
的
欺诈检测。有50000个样本有真实
的
标签(结果是由于调查)。这些训练标签是相当平衡
的
。我选择
的
Logisitic回归模型表现良好,f1得分超过90 %。现在,当使用该模型预测新病例时,结果是50/50(欺诈和非欺诈)。有没有办法调整模型,让我们通过非欺诈案件并惩罚假阳性率,以便我们检测到较少
的
欺诈案件(可能少于一百万起
中
的
浏览 82
提问于2020-12-20
得票数 1
1
回答
在
支持向量机训练
中
惩罚误报
、
我正在尝试
在
Encog内部使用SVM训练一个二进制正/负
分类
器。在这个特定
的
例子
中
,数据集是高度不平衡
的
,负面例子超过正面例子
的
数量大约是30:1。
在
模型
的
训练
中
,我故意对负面案例进行欠采样,以大致平衡给予模型
的
正面/负面案例,这种
方法
在
我处理其他问题时效果很好。然而,在这种情况下,最终模型最终具有不可接受
的
高
误报率
,当在不平
浏览 4
提问于2015-01-14
得票数 1
2
回答
使用Pybrain检测恶意PDF文件
、
、
我正在尝试制作一个人工神经网络来
分类
一个PDF文件,通过利用在contagiodump上发现
的
26,000个PDF样本(包括干净
的
和恶意
的
)来将PDF文件
分类
为恶意或干净
的
。对于每个PDF文件,我使用PDFid.py解析该文件并返回42个数字
的
向量。然后,这26000个向量被传递到pybrain
中
;50%用于训练,50%用于测试。这是我
的
源代码: 在对尺寸和其他参数进行了大量调整后,我设法获得了大约0.90%
的
假阳
浏览 0
提问于2013-10-03
得票数 1
1
回答
更新值
的
机器
学习
算法
、
我有一个描述列表,我必须理解其中
的
类别,并在单独
的
列
中
给出输入。
在
一段时间内,我创建了一个关键字列表,如果这些关键字出现在描述
中
,就会指向某个类别。我应该使用哪种
机器
学习
算法来读取关键字并自动更新类别?此外,它还会随着时间
的
推移而
学习
。
浏览 0
提问于2018-05-17
得票数 0
1
回答
如何在云中部署深度
学习
模型?
、
、
我用keras (用于情感语音识别的LSTM
分类
器)与python一起构建了一个深度
学习
模型,它在本地工作得很好,但是当我加载模型或传递音频
分类
时,我得到了很高
的
内存使用量(到目前为止没有问题,因为我
的
机器
中有我试图
在
一个烧瓶web应用程序中将我
的
模型部署到Azure
中
,我
的
问题是:我需要一个云中
的
“超级
机器
”来运行我
的
模型,或者还有其他
方法
来部
浏览 1
提问于2020-12-26
得票数 1
回答已采纳
2
回答
什么时候应该使用主成分分析?
、
在
机器
学习
中
,更多
的
特征或维度会
降低
模型
的
精度,因为有更多
的
数据需要泛化 和 ,这就是所谓
的
维数灾难。我应该在什么时候/如何考虑我
的
数据集具有许多特征,并且我应该
寻找
PCA来进行降维
浏览 2
提问于2019-06-09
得票数 2
4
回答
数据
分类
、
、
我们有一个包含10000条未
分类
数据
的
表,我想根据某些属性对它们进行
分类
,比如文本相似度或某些特征。例如,假设单个列包含姓名、电话号码和性别表A(列表)1 abc 表B(索引表)1 name 2
浏览 0
提问于2017-07-12
得票数 2
3
回答
机器
学习
组合
中
的
个别模型是什么?
、
、
我知道集成
机器
学习
模型是一个由两个或多个
机器
学习
模型组成
的
堆栈。是否有一个词是指那些进入集合模型
的
单个模型?(即特定术语/行话?)“子模型”甚至“煎饼模特”(因为当人们听到‘模型
中
的
一个煎饼’时,一般都明白这是指什么)
浏览 0
提问于2018-04-18
得票数 6
2
回答
FLANN
的
使用可以归入
机器
学习
吗?
、
、
我已经写了一个程序来计算冲浪特征,然后使用FLANN(最近邻居
的
快速库)来匹配和显示最近
的
邻居。现在,FLANN
的
使用可以被认为是使用
机器
学习
,因为据我所知,它是k最近邻搜索
的
近似版本,被认为是
机器
学习
算法(监督
学习
)。
浏览 1
提问于2011-04-29
得票数 1
2
回答
N-Gram分析
在
情感分析
中
的
应用
、
、
、
如何使用N-Gram Analysis进行情感分析?一旦我把一个句子分成一元,二元,三元,e.t,c,我该如何继续下去呢?
浏览 0
提问于2016-03-03
得票数 1
1
回答
支持向量机相对于决策树和AdaBoost算法
的
优势
、
、
、
、
我正在研究数据
的
二进制
分类
,我想知道使用支持向量机比使用决策树和自适应Boosting算法
的
优缺点。
浏览 2
提问于2012-05-16
得票数 9
3
回答
选择
机器
学习
算法和工具
、
我正在处理一个二进制
分类
问题,即需要将我
的
数据分为两类。对于每个实体都提取了5个特征。谢谢和问候,罗希特
浏览 8
提问于2011-12-28
得票数 2
4
回答
对于无监督
的
机器
学习
问题,可以进行特征选择吗?
、
我开始
寻找
在
机器
学习
中进行特征选择
的
方法
。通过快速查看这个帖子,我假设只有在有监督
的
学习
问题上才能进行特性选择:尽管如此,我还是要问:是否有
方法
可以
在
没有已知变量
的
情况下进行特征选择,从而解决
分类
/回归问题?
浏览 0
提问于2018-03-27
得票数 7
回答已采纳
1
回答
在
非正式数据集中查找用户相似之处
、
、
我对这一切都很陌生,我正在组织一个
学习
项目。我决定在像http://en.wikipedia.org/wiki/Enron_语料库这样
的
数据集中找到用户之间
的
相似之处。在做了一些研究之后,我也遇到了基于非正式文本
的
命名实体识别数据集。所以我不缺数据,也不缺目标,我需要了解高水平
的
技术才能达到目的。 一位有价值
的
评论指出,这一问题似乎过于宽泛。我希望在这个问题上发现
的
是我应该集中研究
的
技术
的
广度,
浏览 0
提问于2015-05-09
得票数 3
1
回答
Networkx
寻找
有向图
的
社区
、
、
在
一个名为Gephi ()
的
开源可视化工具中有一个统计数据(模块化),它允许我通过将节点划分成社区来划分它们。我想用图形来完成这个任务(查找社区),然后再将它可视化,这样我就可以对算法找到
的
每个社区运行各种统计数据。 这是我想要使用<e
浏览 2
提问于2015-06-02
得票数 3
1
回答
异构数据
分类
器
、
、
、
我有一个由1000个样本组成
的
L2维数据集,包括5个温度值,5个价格值,一个整数值,代表一个人类专家(undecided=0,good=1,bad=2,danger=4)
的
判断和一个我想要
学习
预测
的
二元决策变量我如何找到一个
分类
器来处理这些异构
的
数据呢? 我正在考虑为每个可能的人类判断(0,1,2,4),so 4
分类
器构建一个
分类
器。因此,对于每个人
的
判断值,我会:-集中和
降低
温度和价格值--也许使用PCA来去除一些
浏览 1
提问于2012-04-27
得票数 1
1
回答
我如何标记或给一个文本
的
文档一个主题?
、
、
我有这些文件
的
一套文件和相应
的
标签。标签--“补偿,基本权利” 现在,我有了多个文档及其相应
的
标记,而另一个没有任何标记
的
测试数据集,我使用什么NLP技术来给这些文档标签呢?我是否使用文本
分类
或主题建模,可以有人指导或建议一些想法。
浏览 0
提问于2020-08-07
得票数 0
回答已采纳
2
回答
确定降维、
分类
和聚类?
、
、
、
假设我有一个人
的
数据集,有100个特征,各种特征,如身高、体重、年龄等等。我想对正常或异常的人进行
分类
。所谓异常,我
的
意思是,如果一个20岁
的
男子是170厘米和150公斤,以确定它
的
异常。我是否应该使用自组织映射来减少维数(这100个特征),然后用K-
方法
将它们
分类
为正常和异常?这是正确
的
做法吗?或者我可以用K把它们
分类
为正常异常,而不需要任何降维?如
浏览 0
提问于2016-01-10
得票数 2
2
回答
有谁能给我一些指导,告诉我一些特别的,具体
的
项目,我可以安排,“让我
的
脚湿润,可以这么说”。
、
、
、
我对数据科学领域完全陌生,主要是因为我工作过
的
每一位雇主都无法向任何客户出售任何使用在这一领域学到
的
技术
的
东西。 我特别感兴趣
的
是
机器
学习
/预测分析。我自己尝试过许多“测试项目”,但当我试图
学习
一些东西时,我似乎需要某种外部
的
“催化剂”来告诉我一个具体
的
目标和一套具体
的
指导方针。
浏览 0
提问于2015-01-22
得票数 2
回答已采纳
1
回答
SGD
分类
器和Logisitc回归有什么区别?
、
、
、
据我理解,SGD
分类
器和Logistic回归似乎相似。损失=对数
的
SGD
分类
器实现Logistic回归,损失=铰链实现线性支持向量机。但这两种算法
中
哪一种会在哪种情况下使用?另外,SGD和Logistic回归有什么相似之处,它们又有何不同?
浏览 0
提问于2018-09-07
得票数 10
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
MIT开发出高效查询方法,以寻找黑盒机器学习分类器的对抗样本
MIT开发出高效“查询方法”,以寻找黑盒机器学习分类器的对抗样本
在机器学习中处理缺失数据的方法
学习:区分识别机器学习中的分类与回归
半监督学习方法在图像分类中的实用性探索
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券