AI视觉迎来“GPT-3时刻”，通用视觉大模型之战打响-

AI视觉迎来“GPT-3时刻”，通用视觉大模型之战打响

发布时间：2023-04-17 信息来源：财联社字体：【大中小】

近日，Meta发布了一个人工智能模型，可以从图像中挑选出单个对象，以及一个图像注释数据集。该模型名为Segment Anything Model（SAM），Meta官方表示这是有史以来最大的分割数据集。SAM是计算机视觉领域发布第一个用于图像分割的、可通过提示（prompt）方式应用的通用大模型，类似自然语言领域（NLP）中的大模型ChatGPT。英伟达人工智能科学家Jim Fan将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”之一——其分割方法可以通用，可对不熟悉的物体和图像进行零样本泛化，初步验证了多模态技术路径及其泛化能力。几乎同一时间，国内智源研究院视觉团队也推出通用分割模型SegGPT，通用视觉大模型之战打响。视觉大模型能把任意图像从像素阵列解析为视觉结构单元，像人类视觉那样理解各类场景，这对自动驾驶、安防、智能家居、工业视觉等众多行业都将带来飞跃式提升。（财联社）

往期推荐