首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

在不同的任务中,我应该选择哪种机器学习算法?

当开始研究数据科学时,我经常面临一个问题,那就是为我的特定问题选择最合适的算法。在本文中,我将尝试解释一些基本概念,并在不同的任务中使用不同类型的机器学习算法。在文章的最后,你将看到描述算法的主要特性的结构化概述。 首先,你应该区分机器学习任务的四种类型: 监督式学习 无监督学习 半监督学习 强化学习 监督式学习 监督式学习是指从有标签的训练数据中推断一个函数的任务。通过对标签训练集的拟合,我们希望找到最优的模型参数来预测其他对象(测试集)的未知标签。如果标签是一个实数,我们就把任务叫做“回归(regre

03

针对恶意软件分类器的可解释性后门投毒

终端安全行业越来越多地采用基于机器学习 (ML) 的工具作为其纵深防御策略的组成部分。特别是,使用源自二进制文件静态分析的特征的分类器通常用于在端点上执行快速、预执行检测和预防,并且通常充当终端用户的第一道防线。同时,了针对恶意软件(malware)检测模型的对抗性攻击的关注度相应增加。该领域的主要焦点是逃避攻击(evasion attack)的发展,其中攻击者的目标是在推理时改变数据点以引起错误分类。然而在本文中关注投毒攻击的潜在问题,它试图影响 ML 训练过程,特别是后门投毒攻击,其中攻击者将精心选择的模式放入特征空间,以便受害者模型学习将其存在与攻击者选择的类别相关联。虽然之前已经针对开源和商业恶意软件分类器的测试证明了规避攻击,但后门投毒为攻击者提供了一种有吸引力的替代方案,它在一开始就需要更多的计算工作,这可能会导致通用规避各种恶意软件样本和目标分类器的能力。当应用于计算机视觉模型而不需要大量投毒样本时,这些后门攻击已被证明是非常有效的,但它们对恶意软件分类域和一般基于特征的模型的适用性尚未被调查。

04

LASSO回归姊妹篇:R语言实现岭回归分析

前面的教程中,我们讲解了在高通量数据中非常常用的一种模型构建方法,LASSO回归(见临床研究新风向,巧用LASSO回归构建属于你的心仪模型)。作为正则化方法的一种,除了LASSO,还有另外一种模型值得我们学习和关注,那就是岭回归(ridge regression)。今天,我们将简要介绍什么是岭回归,它能做什么和不能做什么。在岭回归中,范数项是所有系数的平方和,称为L2-Norm。在回归模型中,我们试图最小化RSS+λ (sumβj2)。随着λ增加,回归系数β减小,趋于0,但从不等于0。岭回归的优点是可以提高预测精度,但由于它不能使任何变量的系数等于零,很难满足减少变量个数的要求,因此在模型的可解释性方面会存在一些问题。为了解决这个问题,我们可以使用之前提到的LASSO回归。

04

[强基固本-视频压缩] 第六~七章: 上下文自适应二进制算术编码

让我们回顾一下使用 H.265/HEVC 系统编码视频帧的主要步骤(图1)。第一步,通常称为“块分割”,将帧分割成称为 CUs (编码单元)的块。第二步涉及使用空间(帧内)或时间(帧间)预测来预测每个块内的图像。当执行时间预测时,CU 块可以被分割成称为 PUs (预测单元)的子块,每个子块都有自己的运动向量。然后,预测的样本值从正在编码的图像的样本值中减去。结果,每个 CU 形成一个二维(2D)差异信号,或称为残差信号。第三步,2D 残差信号样本的数组被分割成所谓的 TUs (变换单元),每个 TU 都会经历离散的 2D 余弦傅里叶变换(对于包含帧内预测强度样本的 4×4 大小的 TUs 除外,这些 TUs 使用离散正弦傅里叶变换)。

01
领券