Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

AI教程
23年12月13日
编辑

centurysee

释放双眼，带上耳机，听听看~！

Meta最新发布的Segment Anything项目涉及了图像分割领域的新任务、模型和数据集，提出了可提示的图像分割任务，基于ViT的图像编码器等模型，以及一个10亿级的图像分割数据集。文章讨论了项目的效果与不足，并提供了详细的信息。

前些日子，Meta放出了他们在CV领域最新的项目——Segment Anything Project，涉及到了图像分割领域的新任务、模型、数据集。而这三个点，就是对应文章——Segment Anything的三个亮点。

新任务

项目提出的新任务的名字叫做可提示的图像分割任务（the promptable segmentation task），即给定图片和一些提示词——点的位置、方框、mask、文字等等，返回图像分割结果。

具体如下图：

Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

模型

模型需要满足几个条件：

支持灵活的prompt
分割掩码的生成满足交互的实时性
能够处理歧义的情况（同一个位置不同粒度的分割）

Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

为了满足上面三个条件，文章提出了如下模型：

一个基于ViT的图像编码器
一个prompt编码器
一个轻量级的掩码解码器

具体结构如下：

Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

数据集

文章提出了一个10亿级的图像分割数据集，数据集的生成方法主要是通过模型在环的数据集标注（model-in-the-loop dataset annotation）过程，实现了标注过程从纯人工、半自动到全自动的过程。

数据集的构建过程其实是一个特别有意思的过程，具体可以参考知乎上的回答——如何评价Meta/FAIR 最新工作Segment Anything？ – 一堆废纸的回答。这个回答将SAM的数据集构造过程与ChatGPT等大语言模型的RLHF的过程做了类比，引出了Data Centric AI的概念。

效果与不足

模型的效果相当惊艳，这里摘录Segment Anything官网上的一些例子。

Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

目前主要的不足是生成的掩码不包含标签。

关注算法工程笔记，获取更多内容。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

Meta最新项目Segment Anything：图像分割领域的新任务、模型、数据集

新任务

模型

数据集

效果与不足

非对称多项式损失算法(APL)：多标签分类新方法

GPT：人工智能时代的新宠

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

StoryDiffusion

归档

{{userData.name}}已认证

新任务

模型

数据集

效果与不足

非对称多项式损失算法(APL)：多标签分类新方法

GPT：人工智能时代的新宠

Meta发布Llama 2: Hugging Face全面支持，模型许可证、预训练词元数排行榜详解

LSTM之父暴脾气又来了！Jürgen Schmidhuber凭什么指责Meta和Llama 2？

SAM Adapter：提高SAM在特定任务上的性能

LabVIEW中部署Unet模型实现图像分割教程