当前位置:首页> AI教程> 深度学习中的少样本学习方法及应用

深度学习中的少样本学习方法及应用

释放双眼,带上耳机,听听看~!
本文介绍了深度学习中的少样本学习方法,包括元学习、数据增强、微调等,以及它们在机器学习领域的应用。

前言 少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题。FSL的全部意义在于让机器学习模型能够用一点点数据学习新东西,这在收集一堆标记数据太昂贵、花费太长时间或不实用的情况下非常有用。

本文转载自DeepHub IMBA

作者 | Christophe Atten

仅用于学术分享,若侵权请联系删除

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

计算机视觉入门1v3辅导班

少样本学习方法

深度学习中的少样本学习方法及应用

支持样本/查询集:使用少量图片对查询集进行分类。

少样本学习中有三种主要方法需要了解:元学习、数据级和参数级。

  • 元学习:元学习包括训练一个模型,学习如何有效地学习新任务;
  • 数据级:数据级方法侧重于增加可用数据,以提高模型的泛化性能;
  • 参数级:参数级方法旨在学习更健壮的特征表示,以便更好地泛化到新任务中

元学习

元学习(学习如何学习)。这种方法训练一个模型学习如何有效地学习新任务。这个模型是关于识别不同任务之间的共同点,并使用这些知识通过几个例子快速学习新东西。

元学习算法通常在一组相关任务上训练模型,并学习从可用数据中提取与任务无关的特征和特定于任务的特征。任务无关的特征捕获关于数据的一般知识,而任务特定的特征捕获当前任务的细节。在训练过程中,算法通过仅使用每个新任务的几个标记示例更新模型参数来学习适应新任务。这使得模型可以用很少的示例推广到新的任务。

数据级方法

数据级方法侧重于扩充现有数据,这样可以帮助模型更好地理解数据的底层结构,从而提高模型的泛化性能。

主要思想是通过对现有示例应用各种转换来创建新的示例,这可以帮助模型更好地理解数据的底层结构。

有两种类型的数据级方法:

  • 数据增强:数据增强包括通过对现有数据应用不同的转换来创建新的示例;
  • 数据生成:数据生成涉及使用生成对抗网络(GANs)从头生成新的示例。

数据级的方法:

参数级方法目标是学习更健壮的特征表示,可以更好地泛化到新的任务。

有两种参数级方法:

  • 特征提取:特征提取涉及从数据中学习一组特征,可以用于新任务;
  • 微调:微调包括通过学习最优参数使预训练的模型适应新任务。

例如,假设你有一个预先训练好的模型,它可以识别图像中的不同形状和颜色。通过在新数据集上微调模型,只需几个示例,它就可以快速学会识别新的类别。

元学习算法

元学习是FSL的一种流行方法,它涉及到在各种相关任务上训练模型,以便它能够学习如何有效地学习新任务。该算法学习从可用数据中提取任务无关和任务特定的特征,快速适应新的任务。

元学习算法可以大致分为两种类型:基于度量的和基于梯度的。

基于度量的元学习

基于度量的元学习算法学习一种特殊的方法来比较每个新任务的不同示例。他们通过将输入示例映射到一个特殊的特征空间来实现这一点,在这个空间中,相似的示例放在一起,而不同的示例则分开很远。模型可以使用这个距离度量将新的示例分类到正确的类别中。

一种流行的基于度量的算法是Siamese Network,它学习如何通过使用两个相同的子网络来测量两个输入示例之间的距离。这些子网络为每个输入示例生成特征表示,然后使用距离度量(如欧几里得距离或余弦相似度)比较它们的输出。

基于梯度元的学习

基于梯度的元学习学习如何更新他们的参数,以便他们能够快速适应新的挑战。

这些算法训练模型学习一组初始参数,只需几个例子就能快速适应新任务。MAML (model – agnostic元学习)是一种流行的基于梯度的元学习算法,它学习如何优化模型的参数以快速适应新任务。它通过一系列相关任务来训练模型,并使用每个任务中的一些示例来更新模型的参数。一旦模型学习到这些参数,它就可以使用当前任务中的其他示例对它们进行微调,提高其性能。

基于少样本学习的图像分类算法

FSL有几种算法,包括:

  • 与模型无关的元学习(Model-Agnostic Meta-Learning): MAML是一种元学习算法,它为模型学习了一个良好的初始化,然后可以用少量的例子适应新的任务。
  • 匹配网络 (Matching Networks):匹配网络通过计算相似度来学习将新例子与标记的例子匹配。
  • 原型网络(Prototypical Networks):原型网络学习每个类的原型表示,根据它们与原型的相似性对新示例进行分类。
  • 关系网络(Relation Networks):关系网络学会比较成对的例子,对新的例子做出预测。

与模型无关的元学习

MAML的关键思想是学习模型参数的初始化,这些参数可以通过一些示例适应新任务。在训练过程中,MAML接受一组相关任务,并学习仅使用每个任务的几个标记示例来更新模型参数。这一过程使模型能够通过学习模型参数的良好初始化来泛化到新的任务,这些参数可以快速适应新的任务。

匹配网络

匹配网络是另一种常用的少样本图像分类算法。它不是学习固定的度量或参数,而是基于当前支持集学习动态度量。这意味着用于比较查询图像和支持集的度量因每个查询图像而异。

匹配网络算法使用一种注意力机制来计算每个查询图像的支持集特征的加权和。权重是根据查询图像和每个支持集图像之间的相似性来学习的。然后将支持集特征的加权和与查询图像特征连接起来,得到的向量通过几个全连接的层来产生最终的分类。

原型网络

原型网络是一种简单有效的少样本图像分类算法。它学习图像的表示,并使用支持示例的嵌入特征的平均值计算每个类的原型。在测试过程中,计算查询图像与每个类原型之间的距离,并将原型最近的类分配给查询。

关系网络

关系网络学习比较支持集中的示例对,并使用此信息对查询示例进行分类。关系网络包括两个子网络:特征嵌入网络和关系网络。特征嵌入网络将支持集中的每个示例和查询示例映射到一个特征空间。然后关系网络计算查询示例和每个支持集示例之间的关系分数。最后使用这些关系分数对查询示例进行分类。

少样本学习的应用

少样本学习在不同的领域有许多应用,包括:

在各种计算机视觉任务中,包括图像分类、目标检测和分割。少样本学习可以识别图像中不存在于训练数据中的新对象。

在自然语言处理任务中,如文本分类、情感分析和语言建模,少样本学习有助于提高语言模型在低资源语言上的性能。

在机器人技术中使用少数次学习,使机器人能够快速学习新任务,适应新环境。例如,机器人只需要几个例子就可以学会捡起新物体。

少样本在医疗诊断领域可以在数据有限的情况下识别罕见疾病和异常,可以帮助个性化治疗和预测病人的结果。

总结

少样本学习是一种强大的技术,它使模型能够从少数例子中学习。它在各个领域都有大量的应用,并有可能彻底改变机器学习。随着不断的研究和开发,少样本学习可以为更高效和有效的机器学习系统铺平道路。

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

目标检测Trick | SEA方法轻松抹平One-Stage与Two-Stage目标检测之间的差距

少样本学习综述:技术、算法和模型

CVPR 2023 | 标注500类,检测7000类!清华大学等提出通用目标检测算法UniDetector

CVPR 2023|基于多层多尺度重建任务的MIM改进算法

CVPR 2023 | 超越MAE!谷歌提出MAGE:图像分类和生成达到SOTA!

称霸Kaggle的十大深度学习技巧

CVPR 2023 | 用于半监督目标检测的知识蒸馏方法

目标跟踪方向开源数据集资源汇总

CVPR2023 | 书生模型霸榜COCO目标检测,研究团队解读公开

Vision Transformer的重参化也来啦 | RepAdpater让ViT起飞

高效压缩99%参数量!轻量型图像增强方案CLUT-Net开源

一文了解 CVPR 2023 的Workshop 都要做什么

CVPR’23 最新 70 篇论文分方向整理|包含目标检测、图像处理、人脸、医学影像、半监督学习等方向

目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度

PyTorch 2.0正式版来了!

CVPR2023最新Backbone | FasterNet远超ShuffleNet、MobileNet、MobileViT等模型

CVPR2023 | 集成预训练金字塔结构的Transformer模型

AAAI 2023 | 一种通用的粗-细视觉Transformer加速方案

大核分解与注意力机制的巧妙结合,图像超分多尺度注意网络MAN已开源!

MIRNetV2 更快、更强、更轻量!

AI部署与算法/自动驾驶/深度学习资料汇总!

点云模型专栏(一)概述、特性、存储格式、数据集

计算机视觉各个方向交流群与知识星球

【免费送书活动】 全新轻量化模型 | 轻量化沙漏网络助力视觉感知涨点

CV小知识讨论与分析(7) 寻找论文创新点的新方式

CV小知识分析与讨论(6)论文创新的一点误区

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

基于Keras的建模分析 - Kaggle上的真假新闻数据

2023-12-8 20:30:14

AI教程

卷积神经网络发展史及基本原理

2023-12-8 20:33:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索