前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案

什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案

作者头像
机器之心
发布于 2020-05-19 03:53:47
发布于 2020-05-19 03:53:47
8810
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

参与:魔王

什么是小样本学习?它与弱监督学习等问题有何差异?其核心问题是什么?来自港科大和第四范式的这篇综述论文提供了解答。

数据是机器学习领域的重要资源,在数据缺少的情况下如何训练模型呢?小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展,并提出了未来的研究方向。

这篇综述论文已被 ACM Computing Surveys 接收,作者还建立了 GitHub repo,用于更新该领域的发展。

  • 论文地址:https://arxiv.org/pdf/1904.05046.pdf
  • GitHub 地址:https://github.com/tata1661/FewShotPapers

机器学习在数据密集型应用中取得了很大成功,但在面临小数据集的情况下往往捉襟见肘。近期出现的小样本学习(Few-Shot Learning,FSL)方法旨在解决该问题。FSL 利用先验知识,能够快速泛化至仅包含少量具备监督信息的样本的新任务中。

这篇论文对 FSL 方法进行了综述。首先,该论文给出了 FSL 的正式定义,并厘清了它与相关机器学习问题(弱监督学习、不平衡学习、迁移学习和元学习)的关联和差异。然后指出 FSL 的核心问题,即经验风险最小化方法不可靠。

基于各个方法利用先验知识处理核心问题的方式,该研究将 FSL 方法分为三大类:

  • 数据:利用先验知识增强监督信号;
  • 模型:利用先验知识缩小假设空间的大小;
  • 算法:利用先验知识更改给定假设空间中对最优假设的搜索。

最后,这篇文章提出了 FSL 的未来研究方向:FSL 问题设置、技术、应用和理论。

论文概览

该综述论文所覆盖的主题见下图:

我们选取介绍了该综述论文中的部分内容,详情参见原论文。

什么是小样本学习?

FSL 是机器学习的子领域。

我们先来看机器学习的定义:

计算机程序基于与任务 T 相关的经验 E 学习,并得到性能改进(性能度量指标为 P)。

基于此,该研究将 FSL 定义为:

小样本学习是一类机器学习问题,其经验 E 中仅包含有限数量的监督信息。

下图对比了具备充足训练样本和少量训练样本的学习算法:

FSL 方法分类

根据先验知识的利用方式,FSL 方法可分为三类:

FSL 方法解决少样本问题的不同角度。

基于此,该研究将现有的 FSL 方法纳入此框架,得到如下分类体系:

数据

此类 FSL 方法利用先验知识增强数据 D_train,从而扩充监督信息,利用充足数据来实现可靠的经验风险最小化。

如上图所示,根据增强数据的来源,这类 FSL 方法可分为以下三个类别:

模型

基于所用先验知识的类型,这类方法可分为如下四个类别:

算法

根据先验知识对搜索策略的影响,此类方法可分为三个类别:

文章最后从问题设置、技术、应用和理论四个层面探讨了小样本学习领域的未来发展方向。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从少数示例中泛化:介绍小样本学习(Few-shot Learning,FSL)
论文题目:Generalizing from a Few Examples: A Survey on Few-shot Learning(ACM Computing Surveys,中科院 1 区)
叶庭云
2024/05/25
1.3K0
从少数示例中泛化:介绍小样本学习(Few-shot Learning,FSL)
深度学习 | 小样本学习基础概念
人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。Few-shot learning (FSL) 在机器学习领域具有重大意义和挑战性,是否拥有从少量样本中学习和概括的能力,是将人工智能和人类智能进行区分的明显分界点,因为人类可以仅通过一个或几个示例就可以轻松地建立对新事物的认知,而机器学习算法通常需要成千上万个有监督样本来保证其泛化能力。
Justlovesmile
2022/01/28
6.3K1
深度学习 | 小样本学习基础概念
小样本目标检测研究综述
【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!今天给大家带来一篇关于小样本目标检测的研究综述。本文从小样本目标检测任务和问题、学习策略、检测方法、数据集与实验等角度出发,对当前小样本目标检测的研究成果加以梳理和总结。希望这篇文章能对你有所帮助,让你在学习和应用AI技术的道路上更进一步!
算法进阶
2023/09/21
2.5K0
小样本目标检测研究综述
7 Papers & Radios | YOLO v4它来了;北航MangaGAN生成久保带人Style漫画形象
论文 1:Unpaired Photo-to-manga Translation Based on The Methodology of Manga Drawing
机器之心
2020/04/28
7360
样本量极少如何机器学习?最新Few-Shot Learning综述
本文首先介绍了用小样本训练模型会导致的问题,再介绍了Few-Shot Learning的基本原理即三大思路下的方法:增多训练数据,缩小模型需要搜索的空间,优化搜索最优模型的过程。
NewBeeNLP
2021/06/25
4.1K1
​从小样本学习出发,奔向星辰大海
王雅晴,2019年博士毕业于香港科技大学计算机科学及工程学系,研究方向为机器学习,导师是倪明选教授和郭天佑教授,主要聚焦在小样本学习方向。
用户1386409
2022/03/31
3740
​从小样本学习出发,奔向星辰大海
干货!少样本学习的概述!
少样本学习(Few-Shot Learning,FSL)是机器学习领域中的一种重要技术,其目标是在仅使用少量样本(例如50个或更少)的情况下,设计出能够高效学习和准确预测的机器学习模型。这种技术在许多应用领域都具有重要的实际意义,例如在数据标注成本较高的场景中,或者在面对快速变化的任务时。应用包括图像分类、情感分类和对象识别。
算法进阶
2024/06/13
6840
干货!少样本学习的概述!
ICLR 2023杰出论文奖得主分享:适配任意密集预测任务的通用小样本学习器
---- 新智元报道   来源:微软亚洲研究院 作者:罗翀 【新智元导读】近期,来自KAIST和MSRA的研究员提出了首个适配所有密集预测任务的小样本学习器 VTM,以轻量化的迁移成本,赋予了计算机视觉模型预测新任务标签的能力,为计算机视觉中密集预测任务的处理以及小样本学习方法打开了全新思路。 国际学习表征会议 ICLR(International Conference on Learning Representations),被公认为当前最具影响力的机器学习国际学术会议之一。 在今年的 ICLR
新智元
2023/05/09
3230
ICLR 2023杰出论文奖得主分享:适配任意密集预测任务的通用小样本学习器
工业缺陷检测深度学习方法综述
基于深度学习的工业缺陷检测方法可以降低传统人工质检的成本,提升检测的准确性与效率,因而在智能制造中扮演重要角色,并逐渐成为计算机视觉领域新兴的研究热点之一。其被广泛地应用于无人质检、智能巡检、质量控制等各种生产与运维场景中。
一点人工一点智能
2022/12/27
1.8K0
工业缺陷检测深度学习方法综述
小样本学习(Few-shot Learning)综述
笔者所在的阿里巴巴小蜜北京团队就面临这个挑战。我们打造了一个智能对话开发平台——Dialog Studio,以赋能第三方开发者来开发各自业务场景中的任务型对话,其中一个重要功能就是对意图进行分类。大量平台用户在创建一个新对话任务时,并没有大量标注数据,每个意图往往只有几个或十几个样本。
机器之心
2019/04/29
5.9K0
小样本学习(Few-shot Learning)综述
业务数据全用上也喂不饱AI?试试这个小样本学习工具包
机器学习在数据密集型的应用中取得了极佳的效果,但在数据集很小的场景下,多数机器学习算法的效果会严重受限[1]。在计算机视觉、自然语言处理等大领域下,从深度学习最初大放异彩的图像分类、文本分类,到进一步的图像生成、文本关系预测,机器学习算法取得的成就大多建立在大量数据驱动的训练算法之上。然而,高质量的标注数据在大多数领域都是很难获得的,这限制了诸多机器学习算法在相应场景下的应用能力。
量子位
2021/10/20
6070
【深度学习】迁移学习中的领域转移及迁移学习的分类
根据分布移位发生的具体部分,域移位可分为三种类型,包括协变量移位、先验移位和概念移位
Twcat_tree
2023/12/08
1.2K0
【深度学习】迁移学习中的领域转移及迁移学习的分类
使用PyTorch进行小样本学习的图像分类
近年来,基于深度学习的模型在目标检测和图像识别等任务中表现出色。像ImageNet这样具有挑战性的图像分类数据集,包含1000种不同的对象分类,现在一些模型已经超过了人类水平上。但是这些模型依赖于监督训练流程,标记训练数据的可用性对它们有重大影响,并且模型能够检测到的类别也仅限于它们接受训练的类。
deephub
2022/11/11
1.2K0
使用PyTorch进行小样本学习的图像分类
【综述专栏】少样本学习综述
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。
马上科普尚尚
2021/07/28
7310
小样本学习及其在美团场景中的应用
美团的各个业务有着丰富的NLP场景,而这些场景中模型的构建需要很多的标注资源,成本很高。小样本学习致力于在数据资源稀少的情况下训练出比较好的模型。本文从主动学习、数据增强、半监督学习、领域迁移、集成学习&自训练几个方向介绍了现有的一些方法,并在美团场景进行了实验,效果上也取得了一定的提升。希望能对从事相关研究的同学有所帮助或者启发。
美团技术团队
2021/08/26
1.5K0
【源头活水】探究小样本学习中等变性与不变性表示的互补优势
“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注。
马上科普尚尚
2021/03/17
6740
【源头活水】探究小样本学习中等变性与不变性表示的互补优势
27页综述,354篇参考文献!最详尽的视觉定位综述来了
27 页综述,354 篇参考文献!史上最详尽的视觉定位综述,内容覆盖过去十年的视觉定位发展总结,尤其对最近 5 年的视觉定位论文系统性回顾,内容既涵盖传统基于检测器的视觉定位,基于 VLP 的视觉定位,基于 MLLM 的视觉定位,也涵盖从全监督、无监督、弱监督、半监督、零样本、广义定位等新型设置下的视觉定位。
机器之心
2025/02/03
2600
27页综述,354篇参考文献!最详尽的视觉定位综述来了
ICML 2020 | 小样本学习首次引入领域迁移技术,屡获新SOTA结果!
本文介绍的是ICML2020论文《Few-Shot Learning as Domain Adaptation: Algorithm and Analysis》,论文作者来自中国人民大学卢志武老师组。
AI科技评论
2020/06/29
3.3K0
ICML 2020 | 小样本学习首次引入领域迁移技术,屡获新SOTA结果!
TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述
机器之心专栏 机器之心编辑部 来自清华大学的研究者王鑫、陈禹东、朱文武撰写了一篇名为《A Survey on Curriculum Learning》的课程学习综述论文,该论文已被TPAMI 2021收录,本文对其展开介绍。 原文地址:https://ieeexplore.ieee.org/document/9392296 论文地址:https://arxiv.org/pdf/2010.13166.pdf 课程学习是一种训练策略,它模仿了人类课程中有意义的学习顺序,从较容易的数据开始训练机器学习模型,并
机器之心
2023/03/29
4510
TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述
美团获得小样本学习榜单FewCLUE第一!Prompt Learning+自训练实战
总第515篇 2022年 第032篇 近日,美团搜索与NLP部NLP中心语义理解团队的小样本学习模型FSL++在中文小样本语言理解权威评测基准FewCLUE榜单登顶,在自然语言推理(OCNLI)单任务中取得第一,并在极少数样本(一个类别仅100余个)的条件下,在新闻分类(TNEWS)、科学文献学科分类(CSLDCP)任务上超过了人类识别精确度。 1 概述 2 方法介绍 2.1 增强预训练 2.2 模型结构 2.3 数据增强 2.4 集成学习&自训练 3 实验结果 3.1 数据集介绍 3.2 实验对比 4
美团技术团队
2022/06/13
1.3K0
美团获得小样本学习榜单FewCLUE第一!Prompt Learning+自训练实战
推荐阅读
相关推荐
从少数示例中泛化:介绍小样本学习(Few-shot Learning,FSL)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档